
中国的IT基础不完善影响大数据使用
“中国在大数据方面所具有的优势是规模,可收集上亿的数据,这很难被超越。但中国企业的问题在于近几年发展得过快,因而来不及完善IT业的基础设施。”在10月25~26日的2014年浦江创新论坛上,《大数据时代》作者、牛津大学教授维克托·迈尔·舍恩伯格(Viktor Mayer-Schonberger)接受《第一财经日报》记者采访时如此描述中国在大数据时代下的现存问题。
在舍恩伯格看来,基础设施的不完善就意味着无法全面收集和处理数据。因此他建议,中国应在IT基础设施建设、鼓励数据抓取和处理领域投入更多。“明天就可以开始投入,而这种投入没有终点,需要不断完善。”舍恩伯格对《第一财经日报》记者表示。
《经济学人》曾将舍恩伯格定义为大数据领域最受人尊敬的权威发言人之一,因为《大数据时代》一书而在中国风靡的舍恩伯格明确提出了大数据时代的转变。他指出,大数据时代,相关关系比因果关系更重要,即需要知道“是什么”,而非“为什么”。
在本次浦江创新论坛上,舍恩伯格表示,大数据就像是个冰山,浮出水面的只是冰山一角,真正的价值在于水下的巨大部分。挖掘和了解水下的冰山需要反复利用大数据并不断地分析处理以得出有力的结论。
演讲过后,舍恩伯格接受了包括《第一财经日报》在内的中国媒体的采访。在他看来,“大数据的魅力就在于,未来创建公司并不取决于你有多少资金,而是你有多好的创意”。对于下一代的年轻人而言,最需要接受的教育并不是大数据如何分析,而是学习大数据的思维,懂得通过大数据来更好地观察和认识这个世界。一旦能读懂大数据背后的价值,就能找到无限的创新机遇。
大数据时代创业取决于创意
日报:对于年轻的创业者而言,大数据有何益处?
舍恩伯格:大数据最显著的作用在于它让创业的成本越来越小。想象一下,100年前你要建一个工厂,这是多么昂贵的事。但现在创立一个公司可能只需要几千美元的启动资金。如今的创业不需要建立一个厂房,也不需要大量的资金,因为电脑或办公用地都可以租用。
因此,大数据的魅力就在于,现在和未来创建公司并不取决于你有多少资金,而是你有多好的创意。未来我们一定会看到大量拥有创意的年轻创业者的涌现。
日报:上海市政府正在开放大数据,并和企业合作开发大数据的分析产品,你对此有何建议?
舍恩伯格:开放数据是政府大数据策略中的重要因素。因为它不仅仅通过开放了数据以提升社会的公共服务,还刺激了经济的增长,促进了大数据竞争中初创企业的成长。因此,我为上海市政府的这一作为鼓掌,开放数据还将催生更多与数据处理和应用相关的公司和经济。
提到建议,我们在美国和英国所见证的是,这些国家的政府已经开放了数据,但单纯公开还不足够。政府需要建立经济中心或机构去处理和分析数据,以实现大数据的应用。不加以分析和处理的数据只是数据,无人问津,政府还需要帮助企业和个人找到数据的利用价值。
另外,对于企业,我建议,不要只将数据应用在市场分析上,而是要真正创造出新的产品和新视角。
举个例子,在美国调查超市里最好卖的馅饼(Pie)是什么,每个人都回答说是苹果派。看起来美国人最喜欢苹果派。但通过对大数据分析,调查人员发现,如果超市改变了馅饼的大小,那样一个家庭就不需要买一整个大的馅饼,而是可以选择两三个小一点的馅饼,突然间,最好卖的派就不再是苹果派了,人们会选择不同种类的派。所以,现实是,美国人并非最喜欢苹果派。因此,通过对大数据的分析,可以得出更多复杂的细节,也可以找到市场中微小的商机。对于社会而言,大数据也会告诉你这个社会的多元和复杂性,但也可从中找到盈利点。
大数据的使用瓶颈在于分析工具
日报:中国政府和企业目前使用大数据的情况存在哪些问题?
舍恩伯格:我对于中国使用大数据的现状印象深刻。中国在大数据方面所具有的优势是规模,中国可以收集到几亿的数据,这很难被超越。但中国企业的问题在于近几年发展得过快,因而来不及完善IT业的基础设施。基础设施不完善就意味着无法收集和处理全面的数据。
对比发展相对缓慢的德国,企业和IT基础设施一起发展,因此就可以及时捕捉大数据。也就是说,德国比中国有更好的利用大数据的基础。建议中国未来在数据捕捉或处理的基础设施建设上更多投入。这种投入没有终点,需要不断完善。
日报:你认为大数据发展有哪些瓶颈?
舍恩伯格:从技术上来说,主要是分析工具。以前的分析工具主要是用于分析小范围内的数据,现在需要适用于大数据的分析工具。目前有很多大学正在研究。
大数据应用的挑战还在于理念。要充分认识到大数据的预测作用,从而可以反复利用数据带来的价值。因此对于年轻人和儿童而言,最需要接受的教育并不是数据如何分析,而是如何通过大数据来观察和认识这个世界。就像看到这个房间时看到的不只是沙发和桌子,还有室内能源消耗从而影响气候的数据等。
可以说,人们尚未建立对大数据影响的普遍认识是大数据发展的最大瓶颈。
如今谷歌正在创立无人驾驶的汽车公司。但谷歌是最擅长收集汽车驾驶情况和交通环境等各种数据的公司。未来的汽车公司也不再是传统的汽车生产型公司,而是可以提供可利用的数据来创造商机的服务型公司。
大数据时代需要新的隐私保护法
日报:有竞争的企业不愿共享信息这一问题如何解决?
舍恩伯格:有竞争关系的大公司的确不可能共享信息。这中间就存在巨大的商机,会催生新创立的小公司来做中间的连接。显然,美国各大航空公司不会合作建一个网站,发布它们的机票价格信息。这就出现了一家做机票打折信息服务的小企业,它分别与航空公司洽谈,每月支付一定的数据使用费来获取机票的价格来提供给乘客,从而让双方受益。
日报:在大数据时代,如何保护用户的隐私?
舍恩伯格:没有信任就没有大数据。政府的职责是要去建立使用大数据的法律法规以保护用户的隐私。
欧美现在面临的问题是,原先对于隐私的保护法规条例并不适用现在的大数据时代。我们非常需要一个全新的机制来保护个人隐私。新的机制不应该再是去询问用户愿不愿意分享这一数据,因为很多用户没有看条款就点击“同意”了。大数据时代需要法律法规来规定,基于怎样目的的数据可以被利用,哪些又不能被使用。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Pandas 多列条件筛选:从基础语法到实战应用 在数据分析工作中,基于多列条件筛选数据是高频需求。无论是提取满足特定业务规则的 ...
2025-08-12游戏流水衰退率:计算方法与实践意义 在游戏行业中,流水(即游戏收入)是衡量一款游戏商业表现的核心指标之一。而游戏流水衰退 ...
2025-08-12CDA 一级:数据分析入门的基石 在当今数据驱动的时代,数据分析能力已成为职场中的一项重要技能。CDA(Certified Data Anal ...
2025-08-12破解游戏用户流失困局:从数据洞察到留存策略 在游戏行业竞争白热化的当下,用户流失率已成为衡量产品健康度的核心指标。一款游 ...
2025-08-11PyTorch 中 Shuffle 机制:数据打乱的艺术与实践 在深度学习模型训练过程中,数据的呈现顺序往往对模型性能有着微妙却关键的影响 ...
2025-08-11数据时代的黄金入场券:CDA 认证解锁职业新蓝海 一、万亿级市场需求下的数据分析人才缺口 在数字化转型浪潮中,数据已成为企业核 ...
2025-08-11DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08CDA 数据分析师:解锁数据价值的专业力量 在当今这个数据爆炸的时代,数据已成为像石油一样珍贵的战略资源。而 CDA 数据分析师, ...
2025-08-08人工智能对CDA数据分析领域的影响 人工智能对 CDA(Certified Data Analyst,注册数据分析师)数据分析领域的影响是全方位、多层 ...
2025-08-07SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-08-07SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-08-07CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-07大数据时代对定性分析的影响 在大数据时代,海量、多样、高速且低价值密度的数据充斥着我们的生活与工作。而定性分析作为一 ...
2025-08-07K-S 曲线、回归与分类:数据分析中的重要工具 在数据分析与机器学习领域,K-S 曲线、回归和分类是三个核心概念与工具,它们各 ...
2025-08-07CDA 数据分析师考试全解析 在当今数字化时代,数据已成为企业发展的核心驱动力,数据分析师这一职业也愈发受到重视。CDA 数据分 ...
2025-08-07大数据时代的隐患:繁荣背后的隐忧 当我们在电商平台浏览商品时,系统总能 “精准” 推送心仪的物品;当我们刷短视频时,算法 ...
2025-08-07解析 F 边界检验:协整分析中的实用工具 在计量经济学的时间序列分析中,判断变量之间是否存在长期稳定的均衡关系(即协整关系) ...
2025-08-07CDA 数据分析师报考条件详解:迈向专业认证的指南 在数据分析行业蓬勃发展的当下,CDA 数据分析师认证成为众多从业者提升专业 ...
2025-08-07通过 COX 回归模型诊断异常值 一、COX 回归模型概述 COX 回归模型,又称比例风险回归模型,是一种用于生存分析的统计方法。它能 ...
2025-08-07