京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代知识的停止点_数据分析师考试
毫无疑问,信息超载作为一种生活方式,已经挟裹着众生的生活。戴维·温伯格《知识的边界》所尝试的,恰是在大数据时代,如何认知网络下的知识与科学。因为,不管确定“互联网+”,还是定义“互联网-”,都要面对今日“事实不再是事实”,而“专家随处可见”的现实。
显然需要理清思路,理性面对这一切。你要学会像戴维一样,冷静地打着比方,包括以转述的方式,向自己的见解缓步、轻松而去——
美国出版公司兰登书屋的创始人之一贝内特·瑟夫出版的一本书里就讲过这么个奇闻轶事:
一天,《哈波斯》杂志的卡斯·坎菲尔徳在编辑部接待一位长相甜美却个性坚决的妇女。这位女同胞很想讨论她自己正在创作的第一本小说。“一本小说应该是多长的篇幅?”她问道。
“这个问题没有确切的答案,”坎菲尔德解释道,“一些像《伊登·弗洛姆》这样的小说,大概只有4万字。而其他的小说,如《飘》,却可能达到30万字。”
“但,普通小说的平均长度大概是多少字?”妇女坚持问道。
“呃,我觉得大概是8万字吧。”坎菲尔德回答。
妇女跳了起来,并欢呼着。“感谢上帝!”她喊道。“我的小说完结了!”
戴维转述这则逸闻并不是让大家简单地笑上一笑。戴维想说的是,面对太多的信息而无法全部知道的事实,其实我们的战略一直是建立一个知识的停止点(stopping points)系统。这是个很有效的方法,很实用于保存和交流知识的纸质媒介。
戴维列举的另一伟大实例同样能说明问题。1836年,达尔文从“小猎犬号”航行归来,完成了将促进他进化论理论的观察。1838年,达尔文对自己的理论有了清晰的想法。1842年,他用铅笔写下了35页的“骨架”,但没有公开。1844年,他写了189页的手稿,没有公开,但指示妻子,如果他死了就将手稿出版。接下来的15年,他研究了藤壶,出版了8本书,生了9个孩子,并且经常和同事通信往来讨论。他还开始了实验科学。但他就是没有出版自己的进化论。他似乎在等着什么?有一天他收到了年轻的博物学家阿尔弗雷德·罗素·华莱士写来的一封信,此后华莱士又寄给了达尔文一份20页的文稿,里面提到的理论和达尔文的进化论基本相似。达尔文万分惊讶,他想成为这个理论的最早提出者,但不想欺骗华莱士,或者怕更为糟糕,让自己看起来是窃取了华莱士的观点。在听取两位亲密同事意见后,1858年7月,伦敦林奈学会安排宣读了华莱士的一篇文章,以及达尔文的两篇文章。林奈学会在自己的杂志上刊发这些文稿后,达尔文才开始在科学家圈内引起关注。这个鼓舞,让达尔文经过13个月的写作,完成了不朽的《物种起源》。达尔文和华莱士的故事,后世有多种解读。纸质出版模式静静地塑造了科学,这是一个例子。同时,那个停止点,格外清晰。
传统的知识是纸的意外产物。没有什么时候,我们对纸的认识这么明确过。纸上的知识,纸上的科学,曾经是一种出版的类型,它们经过层层过滤,才能在纸上“行走江湖”。但今天,纸质悄然换作网络。在此背景下,如有达尔文和华莱士的故事上演,恐怕要重新演绎,且绝不会如此安安静静,按部就班,起承转合。
能够明确的是,权威在网络化时代仍然会是一个停止点,但“权威已经不再是一个主要由有资质的人所构成、专门生产特级产品的特殊阶层了”。相反,权威更多地是由功能性来定义,如你的体验一般:权威是你在无数连接中访问的那个最后一个页面——是你决定不再继续去点击其他链接的那个页面。
正如戴维所打的比方一样:当知识变得网络化之后,房间里最聪明的那位,已经不是站在屋子前头给我们上课的那位,也不是房间里所有人的群体智慧。房间里最聪明的人,是房间本身:是容纳了其中所有的人与思想,并把他们与外界相联连的这个网。换句话说,互联网作为知识的基础设施,本身并不拥有创造知识的实体要件,知识不存在于书籍之中,也不存在于头脑之中,而是存在于网络本身。
以下事实正越来越清晰:传统的图书在表达观点的方式和呈现形态上,是将思想挤压到一条狭长的小径上,驱使读者沿着这条小径行进。网络化时代,从最为纯正的网络意义上,它的开放姿态,决定每个人都遭遇了网络所带来的心理颠覆——丰富性、链接、无需许可、公共性、未决性,但网络化的知识和科学,会让我们更加接近关于知识和科学的真理。但就在这浩若烟海之中,我们一样要找到知识的停止点,在心里给它个飞吻。
网络,如尼古拉斯·卡尔说的那样,重装了我们的大脑。在信息洪流之中,众生得以不必焦虑,并能轻松自在地在网络之上“笑傲江湖”的方式,或许是找到那一个个知识的停止点。从这个意义上,我们要再回看一下本文开始时戴维·温伯格转述的故事,大笑三声,一起释怀。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16