
CDA数据分析师 出品
编译:Mika
【导读】
Jer Thorp是来自加拿大温哥华的艺术家和教育家,目前居住在纽约。他的可视化艺术实践中探索了科学和艺术之间的多重边界。在本文中他分享了数据背后所蕴含的令人意想不到的重量。
今天我想跟大家聊聊两件非常振奋人心的内容,你们可能已经猜到是什么了,那就是数据和历史。
我不是个历史学家,我不是来跟你们讲历史定义的,而是想让你们通过一个框架看待历史。
当我们创造历史,或是撰写历史文献时,我们是在把过去发生的事衔接在一起变成一个故事。
让我先来讲一个我自己的故事。和大多数年龄相仿的计算机工作者一样,我曾是个善于社交、受欢迎的年轻人,而且擅长运动的年轻人。和大多数年龄差不多的同行一样,我深受苹果公司的影响。
但是注意看我选的这个商标,左边那个苹果,不是右边那个。我深受右边那个苹果的影响,就像每个人一样。但是左边那个苹果,看看这标志,是个彩虹,但是顺序是错的!真不知道苹果公司是怎么想的。
但对苹果公司我不想说太多,我想跟你们说一个机器的事儿。我现在回过头来想,真是不可思议啊!那是一个周三,是我大概12岁的时候,我还没有电脑。到了周四,我就有了一台电脑。
你能想象这变化吗?翻天覆地的变化。没有事物可以像电脑那样改变我们的生活。
但我其实也不想聊电脑的事儿,我想聊聊电脑上的一个程序。程序的创始人不是左边那个,右边那个才是。大家知道右边那人是谁吗?从来都没人知道,这是比尔·阿特金森。多亏比尔·阿特金森做的很多事,才有了我们现在每天在电脑上看到的东西。
▲ 乔布斯和HyperCard的开发人员比尔·阿特金森
但是我想重点说说比尔写的一个程序叫做 HyperCard。HyperCard 曾是苹果电脑的附赠品,为苹果电脑使用者设计的,在电脑上编程时用。
▲ HyperCard
如今听起来很疯狂,这些程序不是我们如今使用的app。app是有很大的预算和传播度的,而这些程序只是很小的程序。有人用它来记录当地篮球赛的比分,有人用来整理论文,有人用来做古典音乐的教学,或者计算奇怪的天文日期。
当然还有一些是艺术项目,这是我最喜欢的一个叫做“If Monks Had Macs”,是个非线性探索环境。
▲ If Monks Had Macs
HyperCard让我感激我能生在这个时代,让我有机会使用HyperCard。Hypercard是最后一个电脑自带的,设计给用户编程的附赠品。如果你告诉电脑的发明者们有那么一日,所有人都有了电脑,却没人知道如何编程,他们一定会觉得你疯了。
让我们快进几年,我最初的职业是艺术家。我用电脑创作一些小玩意儿,比如研究植物的生长系统。还有在这个例子中,我用像素间的颜色互换来模拟经济模式,调查这些系统是如何运作的,我乐在其中。
这个项目使我开始从事数据相关的工作,我对这些图像的美观性也很感兴趣,这是伊朗和伊拉克。这个看起来像个钟表,叫做“钟表图”。这是另一个钟表图的例子,在“希望”上叠加“绝望”。实际上是在“希望”上叠加"危机”,“希望”只有三次被"危机"覆盖。
这一系列纽约时报作品的巅峰是几年前,我尝试把一整年的新闻整合到一张图中。于是这一整年的新闻人物,以及他们之间的关系都在这一张图里了。
推特可视化案例-「刚刚到达」
由此,我对更活跃的系统产生了兴趣。这个项目叫“刚刚到达”。我看人们发推特“我刚飞到夏威夷!”——你们懂的,人们总是不经意地在推特上谈到这些。“我真的不是在炫耀,但我刚到夏威夷“。
▲ 推特可视化项目--「刚刚到达」
然后我开始描绘人们的旅程,希望可以利用社交网络和背后的数据建立个模型来跟踪人们的动向。对流行病学家来说,这将是十分宝贵的信息。
推特可视化案例-「互道早安」
这是个类似的项目——它更有趣。在推特上看世界各地的人们互道早安。顺便说一句,我才知道在温哥华西岸的人真的比东岸的人起床晚,互相道早安也晚,东岸的人也更有冒险精神。
▲ 推特可视化项目「互道早安」
再给你们看一个项目,这个可能更实用,我试图把开普勒项目的数据做成更易懂的图像。我刚才给你们看的所有作品,都是做着玩的。
听起来有点奇怪,但这就像HyperCard。我自己创造一些工具,然后我可以和一些人分享。但都是为了自己开心,做着玩的。
所以其实很难给这些工具明确的定位,我的创作介于科学、艺术和设计之间。从HyperCard开始直到今天,我都在建立可视化工具来帮助我理解各种系统。
如今我在纽约时报工作,我是个数据艺术家。工作期间,我接触到很多有趣的项目。
今天会给你们看其中两个。第一个是和马克·汉森一起做的,马克是加州洛杉矶的统计学教授和传媒艺术家。马克来时报时提过一个有趣,而又似乎显而易见的问题。当人们在网上传播信息时,信息是如何从A传到B,或从A传到B、C、D的?
我们都知道人们在网络上分享信息,却不知道传播过程中发生了什么。所以我们决定创造工具来探索这个问题,这个工具叫做Cascade。
我们看这些系统时,一件事导致另一些事,我们称之为建立Cascade。这些Cascade是逐渐发生的,所以我们的跟踪建模也需要一段时间。
▲ Cascade
很多人都在传播纽约时报上的信息,因此Cascade看起来其实是这样的。这是个常见的Cascade,最左下方是第一个事件,当信息从一个人传播到另一个人时,这个点向上沿y轴延伸 y轴是分离程度。同时向x轴延伸 x轴是时间。
现在我们可以从很多角度看这个问题,这是线型角度,这个是把线型堆叠,成为这样的立体角度。
今天,时报每个月发表约7000篇文章,所以建立这个工具时很重要的一点是,把它建成一个可探索的模型,这样人们可以在大量数据中挖掘他们需要的信息。
就像是给人们提供了一辆车,在这大量的数据中畅通无阻,这样人们可以在大量数据中挖掘他们需要的信息。
实况中的Cascade 看起来是这样的。
不得不说,这是一个重要的时刻。那么久以来,我们接受了太多假新闻。所以当我们第一次看到这一幕时,就好像考古学家把灰尘从恐龙骨架上抖落一样。
我们发现了并第一次看到,这些网络共享信息的结构。拿恐龙来打比方好像挺合适的,因为我们是在对这些事之间的关联,做概率性的推测。当我们看着这些碎片信息做出假设时,我们尽力确保它们的严谨性。
推特是故事的一部分,叙事的一部分。我们在创建历史,但它们不过是短暂的历史。
这些大型的Cascades往往是最有趣的,当然有些小型的Cascades 也是很有意思的。这是我很喜欢的一个 叫“rabbi cascade”。是拉比们(犹太教学者) 围绕纽约时报中的一篇文章的对话。
实际上,宗教工作者休息时间非常有限,周六和周日他们好像不太能放假。
于是在这个Cascade里,有一群拉比在谈论一个纽约时报发表的故事。其中一个拉比给自己取的推特用户名很厉害叫“ The Velveteen Rabbi” (注:Velve teen Rabbit/绒布小兔子是一本英国儿童读物,此处取名去掉了t)。如果没有这个初步工具,我们永远不会找到这些信息,这些信息只会停留在某些角落,永不得见天日。把信息整合,然后建立叙事性结构,创作历史,我发现了无穷的乐趣。
我两年前搬到纽约,在纽约人人都有一个故事,是关于发生在2001年9月11日的那个重大事件。我自己的那个故事有些复杂,因为我花了很多时间在曼哈顿的9/11事件纪念碑。
9/11事件纪念碑的核心理念在于那些纪念碑上的名字,不是按字母顺序排列,也不是按年份排列,而是通过可以体现遇难者之间的关系的方式排列。弟兄和弟兄一起,同事和同事一起,所以这个纪念碑考虑了种种连接,这些人曾经在生活中的连接。
▲ 9/11事件纪念碑
我和一个叫做Local Projects的公司合作,做了一个算法软件,来帮助建筑师们决定这个纪念碑的排列方式。
一共有将近3000个名字,将近1500个邻接的请求。这些连接的请求,所以这是一个很密集的故事和叙事,需要在一个纪念碑上呈现。我和Jake Barton一起制作了这个软件,让建筑师可以首先制作一个可以满足所有请求的布局,然后在某些地方做改动,从而可以表达他们想要的故事。
我想在我们这个社交网络统领的时代,这个纪念碑是个与时俱进的概念。因为这些现实中的社交网络,在纪念碑中能够得以呈现。最令人感动的就是前去纪念碑,看到这些人的名字是如何彼此相邻,来呈现他们在世时的生活的。
▲ 9/11事件纪念碑
那么,这些对于我们的生活有什么影响呢?
我不知道你们还记不记得,今年春天出了这么一件事,饱受争议。人们发现在iPhone上,还有在电脑上,有大量定位信息被储存。
苹果公司回应说,这些定位信息跟你们无关,而跟你们居所的无线网络有关。所以这跟你们无关,而是跟你们在哪有关。
这是很宝贵的数据,对研究者来说 这些移动数据像金子一样宝贵。于是我们想到:有多少人都在用iPhone啊?在座的有多少人用iPhone?所以在这个房间里,就有研究者们很喜欢的大量的定位信息。
于是我们创造了一个叫做Open Paths的系统,它可以让人们上传iPhone的数据,并与研究人员建立代理关系来共享这些数据,把这些信息贡献给有需要的人。
Open Paths的初步模型很成功,我们收到了成千套的数据。我们制作了一个界面,让人们可以看到自己的生活是如何展开的。从这些被你忽视在手机里的蛛丝马迹中。我们没有想到这个体验会是这样感人。
我上传数据的时候心想,没什么大不了的;我知道我住在哪;我知道我在哪上班;通过这个我能看到什么?
结果我看到了我来到纽约,走下飞机的那一刻,那一晚去吃泰餐的餐馆,想象着纽约新生活的开始。我遇到女友的那一天,这是拉瓜迪亚机场,这是在阿姆斯特丹大道上的泰国餐厅,这是我遇到我女友的时候。
你们看到了吗?我第一次讲这些故事和我第二次讲的时候,有什么区别?
我们不经意间,把这些信息放在了人类语境中,通过把信息放在生活语境中,信息就产生了意义,这非常非常重要。
因为我们的历史被保存在这些手机里,从这个角度来看这个人类语境的角度。
首先,我们可以更好理解我们,分享的是哪一类的信息,但如果我们可以把其他信息也放在人类语境中。我想很多事情都会被改变,因为它能自动让在这些系统的人们身临其境,这会导致最基本的尊重。
在我看来这一点在技术行业中往往是缺失的。当我们在处理一些事情,比如隐私时,如果我们明白数字不仅仅是数字,而是与现实连接在一起的,它们就变得举足轻重。有了这一层理解,对话就可以变得不同。
你们中多少人曾点过按钮,许可第三方公司获取你的定位信息的?很多人吧。第三方公司是开发商,第二方公司是苹果,可是第一方却从没有获得这些信息!
我想这是因为我们把这些信息看作是抽象的,可以被搁置不顾的,我们没有把它们放入人类语境中,使它们的价值变得更重要。我请求你们做的事很简单,从更人类语境的角度看待数据,这真的不难。
当你看到股价时,想一下背后的人类语境。当你看到贷款报告时,想一下背后的人类语境。
很显然,大数据是巨大的商业。一个产业巨头在崛起,想一想我们在之前的资源产业中做得如何,我们做得不好。我想一部分问题在于,我们没有积极参与到有关人文语境的各方面对话中。
我要请求你们做的另一件事是,让更多人参与到这个对话中,艺术家、诗人、作家让有人文学科背景的人们加入到讨论中。
因为我相信数据世界可以革新我们的生活。这和我们在资源产业、金融产业的尝试不同。让我们把人文元素带到故事中,我相信我们一定能带着它走向无限潜能的地方。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
2025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27数据分析在当今信息时代发挥着重要作用。单因素方差分析(One-Way ANOVA)是一种关键的统计方法,用于比较三个或更多独立样本组 ...
2025-04-25