京公网安备 11010802034615号
经营许可证编号:京B2-20210330
对于大数据存在多少偏见乃至误读呢
近几年,得益于资本追捧、企业造势、媒体推广以及公众往往跟风式参与,一些新概念或被引进、或被改造、或被提炼,其中代表性的有:大数据、互联网思维、“互联网+”、云计算、智慧城市、媒体融合、人工智能、IP、VR/AR等。其传播套路(流行持久度)大致为:今天你爆红,明日我当道,各领风骚真热闹。只是,在一阵阵浮躁、喧嚣与狂热的背后,这些新概念究竟有多少真正被正确理解了,而又有多少存在偏见乃至误读呢?

特别值得说说的,首推大数据。
对这个舶来的、随着2012年在有着“大数据商业应用第一人”之称的维克托·舍恩伯格那本全球级畅销书《大数据时代》隆重登场的新概念,先是在国内的互联网业界刮起一阵超级旋风,继而风靡了整个社会,由科技界的热门词变身为社会高频词,人人争说大数据,唯恐掉队落伍。说得更尖锐些,和绝大多数“新概念”一样,“大数据”已经成了许多闭门造车者竭尽全力宣扬的主题。这种现象与2005年盛极一时的Web2.0革命论如出一辙。那么,结果如何呢?在“中国互联网老兵”谢文看来,“一个概念,无论它可以抽象到多么高深的程度,其形成、演变、推广的过程往往却很实在、具体,充斥着不同社会力量的博弈。这个概念的对错与否、生命力的长短、对社会的影响往往不取决于概念本身,而在于它的社会价值”。因此他得出结论,“关于大数据,你知道的都不对!”
《大数据经济》是谢文的第二本书,距离上一部《为什么中国没出Facebook》已过去了五年。很难想象,自上世纪90年代中期留美归国后,就先后在中公网及其所属联众游戏网站、互联网实验室等知名企业担任CEO、董事等职务,曾担任和讯网CEO和雅虎中国总裁等职的业界大咖,频繁在各大纸媒撰文发表业界观察和产业心得的人,在出书这个举动上却如此“惜字如金”。但或许也正是如此,使阅读谢文作品成了一种智性训练和与智者的对话。在谢文冷静、平和的文字背后,体现了他作为中国互联网发展数朝元老的老练沉稳,这种面对汹涌浪潮波澜不惊的定力,除了来自专业理性的思考,便是长年累月、一以贯之的行业沉淀。
按照架构,《大数据经济》旨在向公众澄清有关大数据的一些谬误,正本清源、回归真相。而主体内容则收录了谢文从2012年上半年起至今陆陆续续写的一系列关于大数据现象的专栏文章。虽然每篇议题各有侧重、篇幅也长短不一,但核心绕不开以下几个论点:第一,时下,对大数据的概念界定实际上仍然模糊不清、模棱两可;第二,当前大数据实践都还属于摸着石头过河的阶段,这符合产业发展规律,大体来看,第一波创新尝试集中在网络业、制造业和公共服务业以及三者之间的融合互动上;第三,大数据是一种世界观、历史观、价值观、方法论;第四,数据服务将是未来,而数据共享与公开将是大数据蓝海的历史使命。当然,他更不否认接下来的第五点:大数据时代对社会现有结构、体制、文化和生活方式的冲击与变革远大于计算机时代和互联网时代。“现在正是大数据带来的大变革的前夜,面对这场势将席卷全球的社会大变革,主动比被动好,早动比晚动好,不动不是一个选择。”
仅就这些观点而论,谢文其实并不孤单,就拿国内来说吧,至少像《决战大数据》的作者车品觉、《大数据》和《数据之巅》的作者涂子沛等几位,都与他“英雄所见略同”。
此外,我们也看到了谢文的忧虑。在书中他忧心忡忡地指出,大数据是整个Web2.0革命的重要组成部分,世界网络业的领军公司,例如Google、Facebook、苹果和亚马逊已占据了先发的位置。我国网络业中哪家公司能急起直追,谁就是先行者,否则,就只能扮演受害者的角色了。至于未来的战略方向,谢文建议有识之士重视数据服务业,数据服务业和现有的相关产业的根本区别在于其商业模式是数据驱动型,是对大数据的深度分析加工,是对大数据的多重利用和深度利用,是对现有简单直接商业模式的增值服务。《大数据经济》提到,包括苹果公司和谷歌在内的世界巨头,都在不计成本地全方位增加生产和获取大数据,就是为了在走向数据服务业的过程中赢得先发优势,为未来的领先地位在下一盘很大的棋。
谢文为此毫不客气地批评国内公司一拥而上生产智能手机的现象:“如果自身没有成熟配套的操作系统、开放平台、云计算后台和数据分析加工平台,单兵突进只做手机,也许在某个时段能赚点钱,但从长远看是没有前途的。那些在手机首页集成点自己的服务,高呼抢占网络入口口号的伎俩,在滚滚而来的大数据洪流面前显得那么苍白无力。何不舍弃鸡肋,重新定位,发挥优势,争取不在大数据时代掉队呢?”商业、资本固然有“趋利性”的一面,也就是什么赚钱做什么,而谢文的洞见在于,“趋利性”与“趋势性”并不矛盾,而后者是谋定而后动,去做一些更长远、更深远的产业布局。很可惜,并没有多少人能意识得到这一层,而这恰恰也回应了他当年的“谢氏之问”——为什么中国没有Facebook?
客观地讲,由于《大数据经济》是谢文之前媒体专栏文章的结集,因而在时效性上多少有点欠缺,即便国务院印发的《促进大数据发展行动纲要》也才大半年前的事,但互联网风向转变之快,已不是三五年为一个周期的“后浪推前浪”了。另外,本书还收录了其他非“大数据”主题的文章,议题从移动互联网创新到“互联网+”再到宽带战略、公司研究等等,内容难免显得有些繁杂。不过,鉴于谢文十几年如一日跟踪中国互联网产业的发展步态,锲而不舍地发些看似不合时宜的声音,他的作品仍被笔者列在必读范畴之内。至于媒体把他尊称为“中国的凯文·凯利”,则未免有些不着边际。谢文从来不输出技术哲学,也不信奉先验主义,他只是在持续不断地讲述常识。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-10在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-10在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01