京公网安备 11010802034615号
经营许可证编号:京B2-20210330
动态条形图大火了一阵子,尤其是那种对比世界各国历年来的GDP或者军事实力的动态条形图,配上激动人心的音乐,眼看着中国从后往前排名不断考前,作为爱国的人,集体荣誉感爆棚的那种,真的是心潮澎湃自豪到仿佛国力的提升我也做出了不可磨灭的贡献一般(捂脸)。
虽然我没有对国力提升做出什么不可磨灭的贡献,但是我可以探索下动态条形图是怎样绘制的,应该也算是传播知识了吧(笑哭)。
先看下数据,依然是英超各球队的积分数据,制作动态条形图,对数据量要求会稍微大一些,对于有时间维度的数据来说,时间越长,能体现的变化和信息量就会越多,这里我们只选取了从2010–2019年英超各球队的积分数据,这个数据量不算大,但是不影响学习原理和实现步骤。
选取每年前十的球队进入数据集,最终的数据集长这个样子:
我们一步一步来,先绘制一个简单的条形图,比如绘制2019年排名前十球队积分的条形图,准备数据,把2019年的数据提取出来然后进行排序并选择前十名的球队数据,具体代码如下:
year = 2019
dff = (df_t[df_t["年份"].eq(year)]
.sort_values(by='积分', ascending=True)
.tail(10))
dff
结果:
简单解释下,这里并没有复杂的代码,都是常用的语法,除了一个df.eq(),这个方法主要是进行对比,将df中符合括号内变量要求的数据并提取出来,原始的数据中包含了从2010–2019的所有数据,这里只需要2019年的,所以通过这种方式把2019年的数据提取出来。
后边的排序语法选择升序排序,这样排在第一位的是积分最少的球队,所以要选取排名前十的球队不能用head(10),而是用tail(10),选取结尾的10行。之所以这么操作,还是由于条形图绘制过程中是从下往上画,为了条形的排序是从下往上条形越来越长,所以采用这样的操作。
来看一下上边截取出来的数据集绘制出来的条形图是什么样子的:
plt.figure(figsize=(10,6)) plt.barh(dff['球队'], dff['积分']);
ok,画出来是符合要求的条形图!
如果不设置颜色,画出来的所有条都是一个颜色,就像上边的那幅图。
为了让图形更美观,对各个球队的积分变化看起来更明显,还是要设置一下颜色。这里有两个选择,一是对排名设置颜色,即无论哪个球队是第一名,只要排到第一名就会被指定这种颜色,还有一种是给每个球队指定颜色,无论这个球队排名是多少,它的颜色都不会变。
实践证明第二种方法更复杂一点,但是更容易被接受,所以这里采用的第二种方法来设置颜色。
names = df_t10.球队.unique() #查看排名进过前十的球队都有哪些 names
返回结果一共24个球队:
array(['曼联', '切尔西', '曼城', '阿森纳', '热刺', '利物浦', '埃弗顿', '富勒姆', '阿斯顿维拉',
'桑德兰', '纽卡斯尔', '西布罗姆维奇', '斯旺西', '西汉姆联', '南安普敦', '斯托克城', '水晶宫',
'莱斯特', '伯恩茅斯', '西布朗', '伯恩利', '莱斯特城', '狼队', '谢菲尔德联'], dtype=object)
生成24个不同的颜色:
import matplotlib.cm as cm c = [] for i in range(len(names)): c.append(cm.nipy_spectral(float(i)/len(names))) colors1 = dict(zip(names,c)) # 每个球队对应一个颜色
由于颜色种类比较多,一一指定太费时间和精力,所以引入matplotlib.cm色谱,cm.nipy_spectral()函数,赋给它不同的浮点数数值能够生成不同的颜色。
plt.figure(figsize=(12,6))
#给不同的条形添加不同颜色的时候注意颜色列表有24中颜色,不能直接让颜色等于颜色列表
for i in range(len(dff)):
plt.barh(dff['球队'].iloc[i], dff['积分'].iloc[i], color=colors1[dff['球
队'].iloc[i]],alpha = 0.5)
# 在画布右方添加年份
plt.text(1, 0.4, current_year, transform=ax.transAxes, size=46, ha='right',alpha=0.5);
效果图:
其实大家都知道,所谓视频也是由一帧一帧的画面组成按照顺序播放形成视频的,而我们的动图运用的也是这个原理,所以只需把绘制条形图的代码封装成一个函数,然后重复调用这个函数在不同的数据集上绘制图形就可以实现动态展现。
fig, ax = plt.subplots(figsize=(12, 6)) #同时建立画布和子画布,没有设置默认为一个子画布
def draw_bar(year):
ax.spines['right'].set_color('none') #把右边的边框颜色设置为无色,隐藏右边框
ax.spines['top'].set_color('none') #把上边的边框颜色设置为无色,隐藏上边框
ax.spines['left'].set_color('none') #把右边的边框颜色设置为无色,隐藏左边框
ax.spines['bottom'].set_color('none') #把上边的边框颜色设置为无色,隐藏下边框
#准备数据
dff = (df_t[df_t["年份"].eq(year)].sort_values(by='积分', ascending=True).tail(10))
ax.clear() #清空已存在的图像
for i in range(len(dff)):
colors =cm.nipy_spectral(float(i)/len(dff))
ax.barh(dff['球队'].iloc[i], dff['积分'].iloc[i], height=0.7, color=colors1[dff['球队'].iloc[i]],alpha = 0.5)
ax.text(dff['积分'].iloc[i]-3,i+0.1,dff['球队'].iloc[i])
ax.text(dff['积分'].iloc[i]-2,i-0.3,dff['积分'].iloc[i])
ax.text(1, 0.4, year, transform=ax.transAxes, color='#777777', size=46, ha='right',alpha=0.5, weight=800)
ax.xaxis.set_major_formatter(ticker.StrMethodFormatter('{x:,.0f}'))
ax.xaxis.set_ticks_position('top')
ax.tick_params(axis='x', colors='#777777', labelsize=12)
ax.set_yticks([])
ax.margins(0, 0.01)
ax.grid(which='major', axis='x', linestyle='-')
ax.set_axisbelow(True)
ax.text(0.2, 1.1, '2010--2019英超各球队年度积分',
transform=ax.transAxes, size=20, weight=600, ha='left');
draw_bar(2019)
函数已经封装好了,接下来是激动人心实现动图的操作了,需要matplotlib中的animation模块,运用该模块中的FuncAnimation方法重复调用前边定义好的画图函数,实现动画效果:
import matplotlib.animation as animation #导入animation模块 from IPython.display import HTML #导入HTML模块 fig, ax = plt.subplots(figsize=(10, 6)) animator = animation.FuncAnimation(fig, draw_bar, frames=range(2010, 2020),interval = 600) #interval控制更迭速度,默认200毫秒 HTML(animator.to_jshtml()) #将渲染的HTML输出嵌入到iPython输出中 animator.save('yingchao.gif',writer='imagemagick') # 保存 gif 动态图
动态条形图就完活儿了,代码没有很复杂,完整的过程就最后的两段代码,前期的代码主要是分解了中间的过程,方便理解而已,有兴趣的小伙伴可以深入研究或者换个数据集看下实现效果。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28