京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代的知识_数据分析师培训
进入网络大数据时代之后,海量的知识顿时如潮水涌现,令人眼花缭乱。到底哪些是真知识,并且是有用的知识?现在成了一个难题。如果在大数据时代善于将知识有效利用,这也是不错的时代,可惜并非所有人都是如此。《知识的边界》([美]戴维·温伯格著, 胡泳、高美译,山西人民出版社)这本书,就是围绕“大数据时代的知识”一系列问题展开了深层次的探讨和反思。
本书作者戴维·温伯格是哈佛大学资深研究员,围绕网络社会与知识创新等热点话题,经常为美国《连线》《纽约时报》《哈佛商业评论》等报刊撰稿。《知识的边界》一书共分为“知识超载”“深不可测的知识海洋”“长形式,网形式”等九个篇章。每一篇章中,温伯格对于“大数据时代的知识”进行了不同层面、不同维度的分析和梳理。大数据时代的知识是较之印刷时代的知识而言的,印刷时代的知识是静态、单向度、线性的传播方式;而大数据时代的知识则恰恰相反,美国云计算之父马克·贝尼奥夫认为,大数据时代的知识具有社交性、流动性、开放性的特征。而温伯格则在书中一语中的:“大数据时代的知识没有边界、也没有形状。”
大数据时代的知识,没有像印刷时代对知识结构视为必须具备的“基础”,知识是非线性的,可以自由组合、切割,处于一种游离状态,有点“召之即来,来之可取”的意味。温伯格在书中,对一系列基本概念提出了批判性的思考。比如,他在阐发“事实”的概念时,认为人类社会只有到了十九世纪,“事实”才成为知识的基础和解决争论的最终方法。他写道:“但我们应该意识到,那个时期对事实的看法,并非基于事实而是基于发表事实的纸质媒体。”今天大数据时代所提供的“事实”,远远超出了传统书籍的范围, “事实”充满林林总总的分歧和争论。
大数据时代的知识,如同一张无限扩展的大网,将人类所有知识“一网打尽”。而在先前的印刷时代,知识主要依靠出版,少数的知识精英把持知识的传播特权;网络新媒体开启的大数据时代,则是一场更为深远的知识颠覆性变革,知识传播呈几何级数式增长。当前,网络新媒体技术打破了精英与平民之间的知识壁垒,改变了自上而下的知识传播模式,使知识的生产与传播陷入不确定的状态。
温伯格对于大数据时代的知识秉持乐观的态度。从客观上看,大数据时代的知识学习,确实有其便捷性,这是不争的事实。
如果说大数据时代的知识给人带来便捷,那么拓展人们的知识视野,则更有不可替代的优势。2011年以来,一种名为“慕课”(在线学习网络)的学习方式,给知识的学习与传播带来划时代的“革命”。“慕课”的周围,聚集着全球各地的青年学生,他们各自在家中的电脑前,在线聆听老师授课。老师在授课中学生可以随时提问,课后师生之间可以进行互动性的交流,老师在线批改作业,进行课业点评。这种学习知识的新方式,令人们毫无时空的阻隔感。“立体式”的知识传播,使得传统的课堂受到严峻挑战。现在有专家认为,“慕课”猛于虎,那些讲课不精彩、专业基础不扎实的教师,将来在“慕课”的浪潮中面临职业危机。
这里不得不提,大数据时代的知识便捷性只是相对而言。假如高度依赖网络数据进行学术研究或者文学创作,笔者有着隐隐的担忧:因为学者、作家使用数据库后,省略了在稿纸上的“各种比划”,思考中的各种揣摩、猜疑和最初的灵感火花,无法原汁原味地留存。众所周知,学术研究或者文学创作过程中那些潦草、凌乱的文稿笔迹,是知识的半成品,具备极高的研究价值。大数据时代将大脑思索的过程轻而易举地抹掉,应该引起足够的关注。
大数据时代的知识能轻松获得,也并不意味着就能真正掌握知识。大数据时代的知识仅仅是一种资源,好比家中存放成百上千的书籍,如果不去研读,知识和人依然无关。不管处于怎样的一种时代,知识需要人们花苦功夫钻研,否则再多的知识也无意义。另外,现在不少人,凡是有不懂的问题,习惯性地上网搜索,不做任何甄别地将网上的知识和答案奉为宝典。长此以往,久而久之会使大脑变得懒惰,思维变得迟钝。大数据时代的知识,究竟是令人变得聪明还是愚笨?
《知识的边界》一书的魅力,在于它所呈现的思辨层面的丰富性,以及从无数具体的论争、微小的案例出发,对知识本身的学习、生产、传播、知识内部要素以及知识的外部影响,进行了层层深入、环环相扣的论述。在很多看上去不是问题的问题的追问中,温伯格表现出深厚的知识思辨能力,这是极为难得的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel数据透视表进行数据分析时,我们常需要在透视表旁添加备注列,用于标注数据背景、异常说明、业务解读等关键信息。但 ...
2025-12-22在MySQL数据库的性能优化体系中,索引是提升查询效率的“核心武器”——一个合理的索引能将百万级数据的查询耗时从秒级压缩至毫 ...
2025-12-22在数据量爆炸式增长的数字化时代,企业数据呈现“来源杂、格式多、价值不均”的特点,不少CDA(Certified Data Analyst)数据分 ...
2025-12-22在企业数据化运营体系中,同比、环比分析是洞察业务趋势、评估运营效果的核心手段。同比(与上年同期对比)可消除季节性波动影响 ...
2025-12-19在数字化时代,用户已成为企业竞争的核心资产,而“理解用户”则是激活这一资产的关键。用户行为分析系统(User Behavior Analys ...
2025-12-19在数字化转型的深水区,企业对数据价值的挖掘不再局限于零散的分析项目,而是转向“体系化运营”——数据治理体系作为保障数据全 ...
2025-12-19在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12