京公网安备 11010802034615号
经营许可证编号:京B2-20210330
CDA数据分析师 出品
编译:Mika
我们不断在创造着大量的数据。据估计,仅在2020年我们就产生了惊人的59泽字节的数据。
随着如此多的信息四处传播,数据分析已经成为一个不可或缺的专业领域,这并不令人惊讶。
而这其中的一个关键部分就是数据可视化。
用图表表示数据,能够使我们发现新的见解,进行高层次的分析,并以清晰、简洁的方式传达我们的发现,同时这还是一种艺术形式。
在本文中,我们将列举出2021年度那些令人惊艳的可视化作品与你分享。
如前所述,人类在2020年创造了大约59泽字节的数据。要知道,人类在2010年代中期创造的数据才达到1泽字节,这是一个令人难以置信的数量。随着世界范围内数字化连接趋势越来于强,我们的数据生产速度只会更快。
1泽字节相当于六亿个字节,到底是个什么概念呢?不妨看看下图。
(来源:The Guardian / Cisco)
上述可视化无疑使我们更容易理解1泽字节到底有多么庞大,这就是数据可视化的力量。
随着我们产生的数据量不断增长,需要更复杂的可视化技术来理解它。一种越来越流行的数据形式是网络图,这让我们绘制许多不同点或节点之间的关系。对于描绘可视化中出现的连接或群体,网络图是非常不错的选择。
(来源: Kirill Benzi )
这个醒目的网络图不仅仅是一张漂亮的图片。它追踪了《星球大战》宇宙中的2万多个角色之间的联系。每个角色都由一个节点代表。
其中红色代表力量的黑暗面;蓝色代表光明面;黄色表示罪犯和赏金猎人。总共有超过66,000个连接,这恰恰显示了网络图可以有多么强大。
随着智能手机能追踪人们的行动,标记位置的数据正迅速成为一种普遍现象。这在新冠疫情期间被证明特别重要,因为各国争先恐后地跟踪和追查潜在的感染链。在这个例子中,数据可视化软件供应商Tectonix向我们展示了特定位置数据地图的潜力。
(来源:YouTube / Tectonix GEO )
这个可视化图显示了2020年春假期间在佛罗里达州收集的手机定位数据。每个手机信号都由一个红色节点代表。红色节点表示有很多人在享受春假。蓝色强调的区域是劳德代尔堡的一个海滩。
(来源:New York Times / Tectonix GEO )
通过追踪该海滩上的每个节点,Tectonix显示了春假结束时个人旅行的确切地点。因此,我们可以很容易地看到来自该海滩的个人可能已经传播新冠疫情的距离和范围。
虽然有些可视化使用3D元素来增加一点亮点,但最好的可视化是充分地利用三维空间。位于英国的数据分析公司Automatic Knowledge Ltd.的创始人Alasdair Rae在这一可视化过程中完美地说明了这一点。
(来源:Alisdair Rae / statsmapsnpix.com )
利用欧盟免费提供的GHS_POP数据,这些图片显示了整个欧洲的人口密度。该地图被分解成1公里×1公里的方块,条形高度代表了生活在每个地区的人口数量。除了提供引人注目的效果图外,我们还可以一目了然地看到哪里是人口最密集的地区。例如,巴黎、伦敦、马德里和罗马都脱颖而出。
如果没有与数据分析相关的主题,那么这篇文章是不完整的。
考虑到这一点,下面这个图表就通过气泡图和循环网络图显示了在CRAN上300个包中使用的流行编程语言。
(来源: Dr Torsten Sprenger / GitHub )
通过从TIOBE指数(衡量编程语言的流行程度)中获得的数据,这个可视化显示了哪些CRAN软件包是用哪些语言创建的。其中R排在首位,其次是C和C++。不太流行的语言用小圆圈表示。每个圆圈的大小与制作软件包所用的代码行数成正比。
好的数据可视化不需要太过华丽。
如果数据可能被用来帮助政府政策或决策,那么表述清晰是至关重要的。而折线图就是能清晰、简单地绘制时间序列数据的一个优秀工具。
(来源:UNEP GRID )
这张线图追踪了从1880年到2010年代末的全球表面温度。重要的是,它包括来自四个不同来源的数据。NASA、NOAA、日本气象局和MetOffice。通过叠加这四个来源的数据,不难注意到当中的密切相关性,它们均显示了在过去200年里全球表面温度在不断上升。
可视化不应该为了互动而互动。然而,互动性也可以改变我们看待数据的方式。Gov | DNA是一个获奖的在线互动网络工具,探讨了世界各国政府数据。
(来源:Werner Helmich )
该工具将每个国家表现为一个气泡,让你通过点击按钮来比较不同的国家。例如,你可以根据就业、预期寿命、新闻自由和腐败等变量追踪每个国家的世界幸福指数。
流图是一种面积图,通常用于比较时间序列数据。虽然并不总是适合进行深入分析,但它们非常适合提供广泛的概述。
(来源:Talia Bronshtein / insightfulinteraction.com )
由数据记者Talia Bronshtein创作的这幅美丽的流程图描绘了200多年(1820年至2015年)来美国不同移民的国籍。
从中,我们可以看到,在二战期间(1939-1945年),美国的移民几乎停止了。还可以看到,二战前的大多数移民来自奥匈帝国、意大利和俄罗斯等国;到21世纪末,大部分移民来自亚洲和南美国家。
数据可视化不仅仅是用于数据分析,可以是一种艺术形式。
2010年,艺术家Janet Echelman被委托创作一个图,代表西半球35个国家的相互联系。那一年,智利发生了大地震。这一事件的震级如此之大,以至于引发了一场巨大的海啸,使地球的一天缩短了1.26微秒。
(来源:NOAA / PMEL / Center for Tsunami Research )
这张图片显示了由美国国家海洋和大气管理局(NOAA)模拟的地震引起的海啸的热图。Janet Echelman以此为灵感创作了她的雕塑,她用不同颜色的绳子悬挂在一个轻巧的框架上。
(来源:Janet Echelman )
随后的雕塑名为1.26,这也证明了据分析可以和任何艺术领域一样具有创造性。
2021,知名大数据网站FiveThirtyEight用精美的数据可视化讲述了关于新冠疫情、政治局势和体育界的故事。
这里我们列举了当中一些非常惊艳的可视化作品分享给大家。
新冠
美国不愿意接种疫苗人群数据
大多数未接种疫苗的美国人认为疫苗的风险比感染新冠更大
白人孩子最不害怕新冠
政治
加州的罢免程序比大多数州都容易
通货膨胀率上升给美国总统的支持率带来影响
重新划分选区的最新情况
科学
美国大型城市引领可再生能源的发展
美国各地的高温,西部地区的火灾和干旱情况
15年调整平均值和记录的大西洋盆地飓风数据,1851-2019
东京奥运会
没有人能接近博尔特最佳时期的成绩
奥林匹克运动会竞赛项目年表1896-2020年
轮椅运动员在长跑中更能展现出优势
体育
世界象棋桂冠争夺赛
更快并不一定意味着更好
金州勇士队保持明星阵容
Matt Araiza的赛场罚球数据
LeBron James三分球数据
Patrick Mahomes 轻松投出长球
参考链接:
https://careerfoundry.com/en/blog/data-analytics/data-visualization-examples/
https://fivethirtyeight.com/features/our-51-best-and-weirdest-charts-of-2021/
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28