数据可视化效果若干经验与资料分享-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读数据可视化效果若干经验与资料分享

数据可视化效果若干经验与资料分享

2016-04-14

数据可视化效果若干经验与资料分享

文章通过介绍Visualization 即可视化，罗列了数据的展现方式。对于数据分析最困难的一部分就是数据的展示，解读数据之间的关系，清晰有效的传达并且沟通数据信息。

对于数据挖掘，我们可以通过文中对数据可视化的案例找到分析数据、展现数据的方法和思路。

Data visualization 是一件很有趣的事情。最近在尝试处理数据，便顺手翻了翻 visualization 的进展，然后除了 IBM 大名鼎鼎的的 many-eyes 。

还有一个比较好有意思的网站是visualizing。Visualizing 跟 many-eyes 很像，都是社区形式的网站，用户可以注册然后上传，而且网站还有积累下来的很多数据供用户使用。

当然我不是为了介绍这个网站才写这篇 post 的，写 post 是一个记笔记的过程，如果我不能从中学到什么，就有点浪费时间了。下面进入正题，我尝试总结一下 visualization 的时候的几个可用的经验。

应该使用何种形式来表现数据

从 visualizing.org 的分类中提取出来的有用的形式包括（不过说实话这样分类并不是很好用）

Chart
Time series
Map
Flow
Matrix
Network
Hierarchy
Info-graphic

要可视化的数据可以分几类（我想的不全面，欢迎补充，共同学习）

有一系列对象，他们之间相互有关联

写成 A↔B 粗体的拉丁字母表示一系列对象，比如一系列地点。

这种情况下因为要展示数据之间相互关系，所以实质上是一个 network 图，不过通过一些技巧可以把简单的 network 图变成更好的形式。

方式一：使用转换成 flow 图。通过把对象列出两遍来是的原本应该是一个比较复杂难以看清的 network 变成了清晰易查找的 flow。

这类图中我喜欢的一个是 people moving 的 flow

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>数据可视化</a>

这个 flow 图非常好的展示了从一个国家移民到另一个国家，上面的截图就是人们移居（migrate，是移民么？）到加拿大的情况，可以看到中国（CH）移民到加拿大的还是比较多的。通过这样的 flow，我们可以很容易很直观的分析数据。

方式二：圈形的 network 图。为什么要做出圈形呢？因为圈形可以使得连线集中在圈内部，而且可以减少数据交叉。通过 interactive design，可以使得连线无交叉。比如这个 Migrants moving money：

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>数据可视化</a>

这个截图是中国的侨款，也就是中国移民所寄回祖国中国的钱数。可以看排除香港地区，美国是最大的来源。

事实上这种方法与第一种本质是相同的。

方式三：network 图。通过点和连线来关联。例子比如Attractions of Councils: WEF GAC interlink survey

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>数据可视化</a>

但是这个图实际上并不好。而且有时候，线条是可以去掉的，比如这个国际航班的可视化：

Click a nation to see all connected nations via flights. Click again to see arranged nations based on the distance. Double-click the background to reset.

截图：

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>数据可视化</a>

方式四：使用 table。不过为了更直观，使用面积等方式来代表数据的大小。

比如 10 个人任意两个人之间相互按照对对方的好感程度打分，为了展示任意两个人 A 和 B 之间相互的好感程度，可以使用颜色柱来展示，选定一个作为两个人好感程度相同，颜色柱之上的颜色表示 A 对 B 的好感大于 B 对 A 的好感，反之亦然。

这里有个 council 之间的例子，截图如下：

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>数据可视化</a>

层级数据，数据之间可以分成几个层级关系

就是 Hierarchy 图，不过有时候可以省掉连线。

比如这个 soft drink 的 hierarchy 图

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>数据可视化</a>

从这张截图立刻可以看到 coca-cola 和 pepsi 的庞大，通过原网页可以自由的放大缩小来查看不同的公司的产品。

这样的 hierarchy 图要比单调的并列的整整齐齐的列举要包含了更多的信息，因为圆圈的大小可以表示数据的一个维度，甚至还可以引入颜色等等来表示更多的维度。

简单的两维数据，比如某种现象出现的频数

方式一：使用 Histogram。这是比较经典的选择，即使用矩形或者线条的长度来表示数据的大小。例如这个关于能源的 visualization

方式二：使用树图（Tree map），使用面积表示数据的大小。这里有个 UN 的 Global Pulse Visualization 的例子：

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>数据可视化</a>

方式三：使用散点，使用散点的大小或者颜色等属性来表示数据的大小。

一个很优秀的例子是学生坐座位习惯的例子，截图：

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>数据可视化</a>

事实上 tag page 也是属于这类，我们可以通过每个 tag 的大小颜色等等来标示数据的大小。

坐标数据

除了可以使用上面说提到的方式，对于坐标数据，有个特点是可以绘制地图（Map），而 Map 可以与其他形式结合，比如 flow。一个比较好的例子是关于我们坐飞机的一张图，截图如下：

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>数据可视化</a>

图片上部的地图是飞行的出发城市，下部的地图是终点城市。更多内容可以查看UCSB的这个站点，其中提供了 demo 软件。

不同 visualization 的结合

前些时候，以为天文学家 Goodman 写过一篇关于高维天文数据可视化的论文，其中提到了 linked views 很重要，就是说我们要多种可视化方式联合起来展示数据，我截取论文中一张图片来说明。

不同的 visualization 结合起来对数据进行多角度的呈现，可以使我们对数据有更深刻的理解。所以 data mining 实际上是一个应用非常广泛的专业，一个 data mining 专业的学生在现在这种天文专业被大量数据所轰炸真是个宝贝啊。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

数据可视化数据挖掘数据分析

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇图论在大数据分析中的作用！

下一篇CDA认证再升一档！与国家共同推进大数据人才培养标准教育事业！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

数据可视化效果若干经验与资料分享

应该使用何种形式来表现数据

有一系列对象，他们之间相互有关联

层级数据，数据之间可以分成几个层级关系

简单的两维数据，比如某种现象出现的频数

坐标数据

不同 visualization 的结合

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】箱线图上下限计算原理、标准流程与异常 ...

【CDA干货】MySQL固定时间间隔数据查询：语法原理、 ...

从“杂乱信号”到“有序资产”：CDA数据分析师视角 ...

CDA持证人专访：周婧博谈会计行业数据分析与经营诊 ...

【CDA干货】问卷调查卡方检验：原理、前提与实战应 ...

从“整体波动”到“因子归因”：CDA数据分析师视角 ...

【CDA干货】单因素方差分析：三组及以上独立样本的 ...

【CDA干货】次日付费留存计算方法、统计口径与业务 ...

从“点状静态”到“时序动态”：CDA数据分析师视角 ...

CDA持证人专访：王晓琳谈数据分析备考与秋招实战经 ...

【CDA干货】用户决策流程全解析：核心环节、影响因 ...

从“标签”到“人”：CDA数据分析师视角下的用户画 ...

【CDA干货】透视表跨表数据应用原理与实战方法 ...

【CDA干货】正态分布异常事件识别与处理方法：数据 ...

从“raw”到“ready”：CDA数据分析师视角下的标签 ...

CDA持证人专访：孙尚亮谈制造行业数据分析与生产采 ...

【CDA干货】DataFrame数据归一化：核心原理、常用方 ...

从“零散标识”到“结构资产”：CDA数据分析师视角 ...

【CDA干货】数据分析如何辅助商业谈判决策：从经验 ...

【CDA干货】T检验完整实操教程：核心原理、分类场景 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载