京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代知识的停止点_数据分析师考试
毫无疑问,信息超载作为一种生活方式,已经挟裹着众生的生活。戴维·温伯格《知识的边界》所尝试的,恰是在大数据时代,如何认知网络下的知识与科学。因为,不管确定“互联网+”,还是定义“互联网-”,都要面对今日“事实不再是事实”,而“专家随处可见”的现实。
显然需要理清思路,理性面对这一切。你要学会像戴维一样,冷静地打着比方,包括以转述的方式,向自己的见解缓步、轻松而去——
美国出版公司兰登书屋的创始人之一贝内特·瑟夫出版的一本书里就讲过这么个奇闻轶事:
一天,《哈波斯》杂志的卡斯·坎菲尔徳在编辑部接待一位长相甜美却个性坚决的妇女。这位女同胞很想讨论她自己正在创作的第一本小说。“一本小说应该是多长的篇幅?”她问道。
“这个问题没有确切的答案,”坎菲尔德解释道,“一些像《伊登·弗洛姆》这样的小说,大概只有4万字。而其他的小说,如《飘》,却可能达到30万字。”
“但,普通小说的平均长度大概是多少字?”妇女坚持问道。
“呃,我觉得大概是8万字吧。”坎菲尔德回答。
妇女跳了起来,并欢呼着。“感谢上帝!”她喊道。“我的小说完结了!”
戴维转述这则逸闻并不是让大家简单地笑上一笑。戴维想说的是,面对太多的信息而无法全部知道的事实,其实我们的战略一直是建立一个知识的停止点(stopping points)系统。这是个很有效的方法,很实用于保存和交流知识的纸质媒介。
戴维列举的另一伟大实例同样能说明问题。1836年,达尔文从“小猎犬号”航行归来,完成了将促进他进化论理论的观察。1838年,达尔文对自己的理论有了清晰的想法。1842年,他用铅笔写下了35页的“骨架”,但没有公开。1844年,他写了189页的手稿,没有公开,但指示妻子,如果他死了就将手稿出版。接下来的15年,他研究了藤壶,出版了8本书,生了9个孩子,并且经常和同事通信往来讨论。他还开始了实验科学。但他就是没有出版自己的进化论。他似乎在等着什么?有一天他收到了年轻的博物学家阿尔弗雷德·罗素·华莱士写来的一封信,此后华莱士又寄给了达尔文一份20页的文稿,里面提到的理论和达尔文的进化论基本相似。达尔文万分惊讶,他想成为这个理论的最早提出者,但不想欺骗华莱士,或者怕更为糟糕,让自己看起来是窃取了华莱士的观点。在听取两位亲密同事意见后,1858年7月,伦敦林奈学会安排宣读了华莱士的一篇文章,以及达尔文的两篇文章。林奈学会在自己的杂志上刊发这些文稿后,达尔文才开始在科学家圈内引起关注。这个鼓舞,让达尔文经过13个月的写作,完成了不朽的《物种起源》。达尔文和华莱士的故事,后世有多种解读。纸质出版模式静静地塑造了科学,这是一个例子。同时,那个停止点,格外清晰。
传统的知识是纸的意外产物。没有什么时候,我们对纸的认识这么明确过。纸上的知识,纸上的科学,曾经是一种出版的类型,它们经过层层过滤,才能在纸上“行走江湖”。但今天,纸质悄然换作网络。在此背景下,如有达尔文和华莱士的故事上演,恐怕要重新演绎,且绝不会如此安安静静,按部就班,起承转合。
能够明确的是,权威在网络化时代仍然会是一个停止点,但“权威已经不再是一个主要由有资质的人所构成、专门生产特级产品的特殊阶层了”。相反,权威更多地是由功能性来定义,如你的体验一般:权威是你在无数连接中访问的那个最后一个页面——是你决定不再继续去点击其他链接的那个页面。
正如戴维所打的比方一样:当知识变得网络化之后,房间里最聪明的那位,已经不是站在屋子前头给我们上课的那位,也不是房间里所有人的群体智慧。房间里最聪明的人,是房间本身:是容纳了其中所有的人与思想,并把他们与外界相联连的这个网。换句话说,互联网作为知识的基础设施,本身并不拥有创造知识的实体要件,知识不存在于书籍之中,也不存在于头脑之中,而是存在于网络本身。
以下事实正越来越清晰:传统的图书在表达观点的方式和呈现形态上,是将思想挤压到一条狭长的小径上,驱使读者沿着这条小径行进。网络化时代,从最为纯正的网络意义上,它的开放姿态,决定每个人都遭遇了网络所带来的心理颠覆——丰富性、链接、无需许可、公共性、未决性,但网络化的知识和科学,会让我们更加接近关于知识和科学的真理。但就在这浩若烟海之中,我们一样要找到知识的停止点,在心里给它个飞吻。
网络,如尼古拉斯·卡尔说的那样,重装了我们的大脑。在信息洪流之中,众生得以不必焦虑,并能轻松自在地在网络之上“笑傲江湖”的方式,或许是找到那一个个知识的停止点。从这个意义上,我们要再回看一下本文开始时戴维·温伯格转述的故事,大笑三声,一起释怀。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28