用Python绘制棒棒糖图表,真的好看!

开发 后端
条形图在数据可视化里,是一个经常被使用到的图表。虽然很好用,也还是存在着缺陷呢。比如条形图条目太多时,会显得臃肿,不够直观。

[[398564]]

本文转载自微信公众号「法纳斯特」,作者小F。转载本文请联系法纳斯特公众号。

大家好,我是小F~

条形图在数据可视化里,是一个经常被使用到的图表。

虽然很好用,也还是存在着缺陷呢。比如条形图条目太多时,会显得臃肿,不够直观。

棒棒糖图表则是对条形图的改进,以一种小清新的设计,清晰明了表达了我们的数据。

下面小F就给大家介绍一下,如何使用Python绘制棒棒糖图表。

使用到的是我国1949到2019年,历年的出生人口数据,数据来源国家统计局。

首先读取一下数据。

  1. import pandas as pd 
  2. import matplotlib.pyplot as plt 
  3.  
  4. # 读取数据 
  5. df = pd.read_csv('data.csv'
  6. print(df) 

结果如下。

数据集很简单,每行都只有一个年份和一个值。

先绘制一个带有每年数值的条形图。

  1. # 绘制柱状图 
  2. plt.bar(df.Year, df.value) 
  3. plt.show() 

两行代码,即可得到一张条形图图表,看起来确实是有点拥挤。

下面将最后一年,即2019年的数据区分出来。

给2019年的条形着色为黑色,其他年份为浅灰色。

并且在图表中添加散点图,可在条形图的顶部绘制圆形。

  1. # 新建画布 
  2. fig, ax = plt.subplots(1, figsize=(12, 8)) 
  3.  
  4. # 年份数 
  5. n = len(df) 
  6. # 颜色设置 
  7. colors = ['black'] + ((n-1)*['lightgrey']) 
  8. plt.bar(df.Year, df.value, color=colors) 
  9. plt.scatter(df.Year, df.value, color=colors) 
  10. plt.show() 

得到结果如下。

颜色已经修改成功,还需要调整一下条形图的宽度以及顶部圆圈的大小。

  1. # width: 条形图宽度  s: 散点图圆圈大小 
  2. plt.bar(df.Year, df.value, color=colors, width=0.2) 
  3. plt.scatter(df.Year, df.value, color=colors, s=10) 
  4. plt.show() 

结果如下。

比起先前的蓝色条形图图表,棒棒糖图表确实是好看了不少。

除了用条形图来绘制棒棒糖图表,还可以使用线条,这样整体的宽度会更加一致。

X将Year(年份)数据作为起点和终点,Y以-20和各年份数据作为起点和终点。

  1. import pandas as pd 
  2. import matplotlib.pyplot as plt 
  3.  
  4. # 读取数据 
  5. df = pd.read_csv('data.csv'
  6. print(df) 
  7.  
  8. # 新建画布 
  9. fig, ax = plt.subplots(1, figsize=(12, 8)) 
  10.  
  11. # 年份数 
  12. n = len(df) 
  13. # 颜色设置 
  14. colors = ['black'] + ((n-1)*['lightgrey']) 
  15. # 使用线条 
  16. for idx, val in df.iterrows(): 
  17.     plt.plot([val.Year, val.Year], 
  18.              [-20, val.value], 
  19.              color=colors[idx]) 
  20. plt.show() 

得到结果如下。

可以使用参数标记在两端绘制圆,而不是只在顶部生成散点图。

然后可以通过更改y-limit参数来隐藏最底端的圆。

  1. # 新建画布 
  2. fig, ax = plt.subplots(1, figsize=(12, 8)) 
  3.  
  4. # 年份数 
  5. n = len(df) 
  6. # 颜色设置 
  7. colors = ['black'] + ((n-1)*['lightgrey']) 
  8. # 使用线条, markersize设置标记点大小 
  9. for idx, val in df.iterrows(): 
  10.     plt.plot([val.Year, val.Year], 
  11.              [-20, val.value], 
  12.              color=colors[idx], 
  13.              marker='o'
  14.              markersize=3) 
  15.  
  16. # 设置y轴最低值 
  17. plt.ylim(0,) 
  18. plt.show() 

结果如下。

此外还可以调整lw、markersize参数,定义线条的粗细及标记的大小,甚至可以绘制两次线条以创建轮廓效果。

  1. # 新建画布 
  2. fig, ax = plt.subplots(1, figsize=(12, 8)) 
  3. color = 'b' 
  4.  
  5. # 年份数 
  6. n = len(df) 
  7. # 颜色设置 
  8. colors = ['black'] + ((n-1)*['lightgrey']) 
  9. # 使用线条 
  10. for idx, val in df.iterrows(): 
  11.     plt.plot([val.Year, val.Year], 
  12.              [-20, val.value], 
  13.              color='black'
  14.              marker='o'
  15.              lw=4, 
  16.              markersize=6) 
  17.     plt.plot([val.Year, val.Year], 
  18.              [-20, val.value], 
  19.              color=colors[idx], 
  20.              marker='o'
  21.              markersize=4) 
  22.  
  23. # 移除上边框、右边框 
  24. ax.spines['right'].set_visible(False
  25. ax.spines['top'].set_visible(False
  26.  
  27. # 设置x、y轴范围 
  28. plt.xlim(1948, 2020) 
  29. plt.ylim(0,) 
  30.  
  31. # 中文显示 
  32. plt.rcParams['font.sans-serif'] = ['Songti SC'
  33.  
  34. plt.title('中国历年出生人口数据(万)', loc='left', fontsize=16) 
  35. plt.text(2019, -220, '来源:国家统计局', ha='right'
  36.  
  37. # 2019年出生人口数(显示) 
  38. value_2019 = df[df['Year'] == 2019].value.values[0] 
  39. plt.text(2019, value_2019+80, value_2019, ha='center'
  40.  
  41. # 保存图片 
  42. plt.savefig('chart.png'

得到结果如下。

黑色不是特别好看,改个颜色看看。

  1. # 新建画布 
  2. fig, ax = plt.subplots(1, figsize=(12, 8)) 
  3.  
  4. # 年份数 
  5. n = len(df) 
  6. # 颜色设置 
  7. color = 'b' 
  8. colors = ['#E74C3C'] + ((len(df)-1)*['#F5B7B1']) 
  9. # 使用线条 
  10. for idx, val in df.iterrows(): 
  11.     plt.plot([val.Year, val.Year], 
  12.              [-20, val.value], 
  13.              color=colors[idx], 
  14.              marker='o'
  15.              lw=4, 
  16.              markersize=6, 
  17.              markerfacecolor='#E74C3C'
  18.  
  19. # 移除上边框、右边框 
  20. ax.spines['right'].set_visible(False
  21. ax.spines['top'].set_visible(False
  22.  
  23. # 设置x、y轴范围 
  24. plt.xlim(1948, 2020) 
  25. plt.ylim(0,) 
  26.  
  27. # 中文显示 
  28. plt.rcParams['font.sans-serif'] = ['Songti SC'
  29.  
  30. plt.title('中国历年出生人口数据(万)', loc='left', fontsize=16) 
  31. plt.text(2019, -220, '来源:国家统计局', ha='right'
  32.  
  33. # 2019年出生人口数(显示) 
  34. value_2019 = df[df['Year'] == 2019].value.values[0] 
  35. plt.text(2019, value_2019+80, value_2019, ha='center'
  36.  
  37. # 保存图片 
  38. plt.savefig('chart.png'

得到结果如下。

现在对于条形图,你就有了另外一个选择,即棒棒糖图表。

此外我们也能了解到目前中国的新出生人口数量是越来越少,据说2020年出生人口降幅或超一成,未来几年恐跌破1000万...

 

责任编辑:武晓燕 来源: 法纳斯特
相关推荐

2015-03-04 14:07:34

Android5.0 Android2.3

2015-03-04 10:38:11

Android5.0 Android2.3

2014-10-29 09:51:34

2014-10-30 17:43:59

Android 5.0Android Wea

2015-01-22 11:37:44

Android

2014-10-30 17:13:23

Android 5.0Google

2022-08-23 12:32:37

Python可视化图表

2021-09-24 09:45:27

Python神经网络人工智能

2014-10-21 11:36:06

Android 5.0Google

2014-10-30 14:42:57

Android 5.0Google

2022-05-16 09:34:17

Python可视化图表

2014-07-17 15:52:00

Android L

2014-08-18 15:10:16

2014-12-08 12:50:24

Android AutGoogle

2020-09-17 16:00:03

Python 开发编程语言

2015-05-06 11:17:50

Android 5.0Android 5.1

2015-07-22 10:57:36

watchOS图表自定义

2022-07-15 16:04:22

R 语言

2017-06-13 15:37:21

大数据图表绘制常用软件

2011-06-13 17:17:22

Qt 绘图 QWT
点赞
收藏

51CTO技术栈公众号