京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据可视化6大技巧
越来越多的媒体开始接受网络数据,数据可视化便成为不可或缺的一部分。用一个个有效且有逻辑关联性的图形来显示数据、传递信息,能够让人们更加了解事物的本质。虽然现在已经有很多关于数据可视化的教程,但有关数据可视化的学术研究仍然较少。新闻记者更倾向于关注Edward Tufte等人的流行书籍,忽视了学术研究本身。事实上,关于数据可视化的学术文献才是记者新闻工作过程中的探照灯。
关于数据可视化,我们能从学术研究中学到这6点:
1、结合图标来增加说服力
康奈尔大学的研究人员发现,仅在文章中增加一张图表,就能使文章的说服力大大增强。对于同一篇文章,高达97%的参与者更认同那个含有图表的文章所传达的信息。就像某些科学性较强的新闻,它的内容相对来说枯燥且专业性过强,普通的读者一般很难了解新闻想要传达的信息,这时如果记者把数据进行可视化,清晰的数据图表将对读者产生更大的影响。
2、使用饼图、条形图或泡泡,使数据显示得更加清晰
威廉·克利夫兰(William Cleveland)和罗伯特·麦吉尔(Robert McGill)是第一个用科学的结论支持常识性说法并批判现有图表的研究者。1984年,克利夫兰和麦吉尔指导人们根据图表的类型,准确地“解码”各种视觉属性的数据。比 如一个圆的面积、酒吧的体积等等。他们研究所得到的制作图形编码的结论是这样的:
3、超大图表≠最优图表
研究发现,图表的尺寸将在一定程度上影响信息的传播效果。图表越短,读者的关注度越少。然而实际上,随着图表精确度的增加,信息的传播效率得到了更快地提升。研究表明,在页面布局方面,设计师必须考虑制作一个合理大小的图表,这样才能让信息传播的准确性及效率最大化。大图表可能会给读者带来更多的视觉冲击,实则在提高读者信息理解度方面收效甚微。
4、视觉打败记忆:请按空间顺序排列,而非时间
塔玛拉·芒泽(Tamara Munzer)是哥伦比亚大学的计算机科学教授,她建议设计师制作一些让读者更容易理解的可视图。这就意味着要把现有数据按照空间顺序进行比较,而非按时间顺序。用她的话说就是“视觉打败记忆”,因为我们的大脑更倾向于对两个项目进行比较,而非记住一个接一个的动画或视频。她不是首推按空间排列顺序的第一人,但芒泽认为这是一个对数据可视化的好建议。具体而言就是,要对比各项数据,懂得揭示其中的变化和差异,而非简简单单地呈现一个动画。
5、有创意,才难忘!
哈佛大学和麻省理工学院的一只团队正在研究各种形式的大数据可视化。他们试图使可视图更加令人难忘,而非提高图表的有效性和准确性。在收集、分类,并研究了5000多个可视图后,他们认为那些图案多样、颜色鲜艳、视觉密度更高、含有易辨认人物头像的可视图更容易被读者记住。
他们还发现,非传统的图表更令人难忘。同时,这个团队也承认,他们的研究只考虑了可视图的呈现,而忽略了对实际数据的诠释。尽管存在这些限制,但他们的研究也具体、明显地表明,要设计一个能产生持续影响力的可视图,新颖的创意、绚丽的色彩和丰富的图案演示是不可或缺的三要素。
6、真的需要夸大你的图表和插图吗?
最先倡导数据可视化的专家塔夫特提出了一个极具争议性的观点,即太多的图案使可视图的阅读性大大降低。来自加拿大的研究人员质疑这个想法,并且把过多美化的图表和简约的图表做了对比。他们认为,“华丽”的图表实际上并没有降低数据的可读性与准确性。此外,这项研究的参与者发现,人们两个星期后甚至会重新阅读“华丽”的图表。
所以,可视图到底应不应该装饰插图?极简主义者认为,演示图表可以让人们重新思考当下,并批判以往的研究方法。如今,对于修饰与未修饰图表所形成的效果,各种观点仍旧没有达成明确的共识,它留下的艺术价值远甚于科学价值。
关于数据可视化的实践跨越了科学与艺术两个领域。然而,从学术结论转移到实际操作并非易事。最近,《纽约时报》可视图编辑者迈克·博斯托克(Mike Bostock)警告Reddit论坛道:“学术界的危险在于它很容易使一切变得过于抽象。”把抽象转为具体,是一项很值得去做的事情。学术界可以提供一些制作可视图的指导,同时,编辑部也应该时刻留意着象牙塔。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26表格结构数据以“行存样本、列储属性”的规范形态,成为CDA数据分析师最核心的工作载体。从零售门店的销售明细表到电商平台的用 ...
2025-11-26在pandas数据处理工作流中,“列标签”(Column Labels)是连接数据与操作的核心桥梁——它不仅是DataFrame数据结构的“索引标识 ...
2025-11-25Anaconda作为数据科学领域的“瑞士军刀”,集成了Python解释器、conda包管理工具及海量科学计算库,是科研人员、开发者的必备工 ...
2025-11-25在CDA(Certified Data Analyst)数据分析师的日常工作中,表格结构数据是最常接触的“数据形态”——从CRM系统导出的用户信息表 ...
2025-11-25在大数据营销从“粗放投放”向“精准运营”转型的过程中,企业常面临“数据维度繁杂,核心影响因素模糊”的困境——动辄上百个用 ...
2025-11-24当流量红利逐渐消退,“精准触达、高效转化、长效留存”成为企业营销的核心命题。大数据技术的突破,让营销从“广撒网”的粗放模 ...
2025-11-24在商业数据分析的全链路中,报告呈现是CDA(Certified Data Analyst)数据分析师传递价值的“最后一公里”,也是最容易被忽视的 ...
2025-11-24在数据可视化实践中,数据系列与数据标签的混淆是导致图表失效的高频问题——将数据标签的样式调整等同于数据系列的维度优化,或 ...
2025-11-21在数据可视化领域,“静态报表无法展现数据的时间变化与维度关联”是长期痛点——当业务人员需要分析“不同年份的区域销售趋势” ...
2025-11-21在企业战略决策的场景中,“PESTEL分析”“波特五力模型”等经典方法常被提及,但很多时候却陷入“定性描述多、数据支撑少”的困 ...
2025-11-21在企业数字化转型过程中,“业务模型”与“数据模型”常被同时提及,却也频繁被混淆——业务团队口中的“用户增长模型”聚焦“如 ...
2025-11-20在游戏行业“高获客成本、低留存率”的痛点下,“提前预测用户流失并精准召回”成为运营核心命题。而用户流失并非突发行为——从 ...
2025-11-20