京公网安备 11010802034615号
经营许可证编号:京B2-20210330
中国的IT基础不完善影响大数据使用
“中国在大数据方面所具有的优势是规模,可收集上亿的数据,这很难被超越。但中国企业的问题在于近几年发展得过快,因而来不及完善IT业的基础设施。”在10月25~26日的2014年浦江创新论坛上,《大数据时代》作者、牛津大学教授维克托·迈尔·舍恩伯格(Viktor Mayer-Schonberger)接受《第一财经日报》记者采访时如此描述中国在大数据时代下的现存问题。
在舍恩伯格看来,基础设施的不完善就意味着无法全面收集和处理数据。因此他建议,中国应在IT基础设施建设、鼓励数据抓取和处理领域投入更多。“明天就可以开始投入,而这种投入没有终点,需要不断完善。”舍恩伯格对《第一财经日报》记者表示。
《经济学人》曾将舍恩伯格定义为大数据领域最受人尊敬的权威发言人之一,因为《大数据时代》一书而在中国风靡的舍恩伯格明确提出了大数据时代的转变。他指出,大数据时代,相关关系比因果关系更重要,即需要知道“是什么”,而非“为什么”。
在本次浦江创新论坛上,舍恩伯格表示,大数据就像是个冰山,浮出水面的只是冰山一角,真正的价值在于水下的巨大部分。挖掘和了解水下的冰山需要反复利用大数据并不断地分析处理以得出有力的结论。
演讲过后,舍恩伯格接受了包括《第一财经日报》在内的中国媒体的采访。在他看来,“大数据的魅力就在于,未来创建公司并不取决于你有多少资金,而是你有多好的创意”。对于下一代的年轻人而言,最需要接受的教育并不是大数据如何分析,而是学习大数据的思维,懂得通过大数据来更好地观察和认识这个世界。一旦能读懂大数据背后的价值,就能找到无限的创新机遇。
大数据时代创业取决于创意
日报:对于年轻的创业者而言,大数据有何益处?
舍恩伯格:大数据最显著的作用在于它让创业的成本越来越小。想象一下,100年前你要建一个工厂,这是多么昂贵的事。但现在创立一个公司可能只需要几千美元的启动资金。如今的创业不需要建立一个厂房,也不需要大量的资金,因为电脑或办公用地都可以租用。
因此,大数据的魅力就在于,现在和未来创建公司并不取决于你有多少资金,而是你有多好的创意。未来我们一定会看到大量拥有创意的年轻创业者的涌现。
日报:上海市政府正在开放大数据,并和企业合作开发大数据的分析产品,你对此有何建议?
舍恩伯格:开放数据是政府大数据策略中的重要因素。因为它不仅仅通过开放了数据以提升社会的公共服务,还刺激了经济的增长,促进了大数据竞争中初创企业的成长。因此,我为上海市政府的这一作为鼓掌,开放数据还将催生更多与数据处理和应用相关的公司和经济。
提到建议,我们在美国和英国所见证的是,这些国家的政府已经开放了数据,但单纯公开还不足够。政府需要建立经济中心或机构去处理和分析数据,以实现大数据的应用。不加以分析和处理的数据只是数据,无人问津,政府还需要帮助企业和个人找到数据的利用价值。
另外,对于企业,我建议,不要只将数据应用在市场分析上,而是要真正创造出新的产品和新视角。
举个例子,在美国调查超市里最好卖的馅饼(Pie)是什么,每个人都回答说是苹果派。看起来美国人最喜欢苹果派。但通过对大数据分析,调查人员发现,如果超市改变了馅饼的大小,那样一个家庭就不需要买一整个大的馅饼,而是可以选择两三个小一点的馅饼,突然间,最好卖的派就不再是苹果派了,人们会选择不同种类的派。所以,现实是,美国人并非最喜欢苹果派。因此,通过对大数据的分析,可以得出更多复杂的细节,也可以找到市场中微小的商机。对于社会而言,大数据也会告诉你这个社会的多元和复杂性,但也可从中找到盈利点。
大数据的使用瓶颈在于分析工具
日报:中国政府和企业目前使用大数据的情况存在哪些问题?
舍恩伯格:我对于中国使用大数据的现状印象深刻。中国在大数据方面所具有的优势是规模,中国可以收集到几亿的数据,这很难被超越。但中国企业的问题在于近几年发展得过快,因而来不及完善IT业的基础设施。基础设施不完善就意味着无法收集和处理全面的数据。
对比发展相对缓慢的德国,企业和IT基础设施一起发展,因此就可以及时捕捉大数据。也就是说,德国比中国有更好的利用大数据的基础。建议中国未来在数据捕捉或处理的基础设施建设上更多投入。这种投入没有终点,需要不断完善。
日报:你认为大数据发展有哪些瓶颈?
舍恩伯格:从技术上来说,主要是分析工具。以前的分析工具主要是用于分析小范围内的数据,现在需要适用于大数据的分析工具。目前有很多大学正在研究。
大数据应用的挑战还在于理念。要充分认识到大数据的预测作用,从而可以反复利用数据带来的价值。因此对于年轻人和儿童而言,最需要接受的教育并不是数据如何分析,而是如何通过大数据来观察和认识这个世界。就像看到这个房间时看到的不只是沙发和桌子,还有室内能源消耗从而影响气候的数据等。
可以说,人们尚未建立对大数据影响的普遍认识是大数据发展的最大瓶颈。
如今谷歌正在创立无人驾驶的汽车公司。但谷歌是最擅长收集汽车驾驶情况和交通环境等各种数据的公司。未来的汽车公司也不再是传统的汽车生产型公司,而是可以提供可利用的数据来创造商机的服务型公司。
大数据时代需要新的隐私保护法
日报:有竞争的企业不愿共享信息这一问题如何解决?
舍恩伯格:有竞争关系的大公司的确不可能共享信息。这中间就存在巨大的商机,会催生新创立的小公司来做中间的连接。显然,美国各大航空公司不会合作建一个网站,发布它们的机票价格信息。这就出现了一家做机票打折信息服务的小企业,它分别与航空公司洽谈,每月支付一定的数据使用费来获取机票的价格来提供给乘客,从而让双方受益。
日报:在大数据时代,如何保护用户的隐私?
舍恩伯格:没有信任就没有大数据。政府的职责是要去建立使用大数据的法律法规以保护用户的隐私。
欧美现在面临的问题是,原先对于隐私的保护法规条例并不适用现在的大数据时代。我们非常需要一个全新的机制来保护个人隐私。新的机制不应该再是去询问用户愿不愿意分享这一数据,因为很多用户没有看条款就点击“同意”了。大数据时代需要法律法规来规定,基于怎样目的的数据可以被利用,哪些又不能被使用。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 CDA 数据分析师能力体系中,透视分析是数据探索、多维度汇总、业务复盘的核心基础技能。无论是 Excel 数据透视表,还是 Power ...
2026-07-03在市场竞争日趋激烈、获客成本持续攀升的当下,企业粗放式的“广撒网”获客模式早已无法适配经营需求。企业经营的核心逻辑,已经 ...
2026-07-03 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-07-03【核心关键词】运营、企业、核心、客户、新技术、数字化运营、数据分析、传统企业、人工录入、生产系统、技术人员、数据安全、 ...
2026-07-02在产品开发、项目立项、业务拓展、运营优化的工作中,市场调查、竞品分析、需求调研是三大核心基础工作。很多从业者容易将三者混 ...
2026-07-02 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-07-02在MySQL数据库运维与开发工作中,当单表数据量达到千万级、亿级后,会出现查询卡顿、索引失效、写入性能下降等问题。为优化性能 ...
2026-07-01在信息化建设、系统开发、数据分析、需求梳理的工作场景中,业务模型与逻辑模型是两个最基础、也最容易混淆的核心概念。很多项目 ...
2026-07-01 很多数据分析师能熟练计算各种指标,但当被问到“这些指标之间是什么关系”“为什么要选这个指标而不是那个”“指标体系的整 ...
2026-07-01【核心关键词】报表、数据源、客户、营销、业绩、销售、时效性、函数、可视化、运营、数据分析、数据报表、业务部门、数据运营 ...
2026-06-30在数据分析、商业预测、经济统计、运维监控等领域中,绝大多数业务数据都具备时间连续性特征,例如月度销售额、日度客流量、季度 ...
2026-06-30 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-06-30在 SQL Server 安装、服务启动、数据库文件操作等场景中,经常会遇到 “实例已在使用” 类报错,不同触发场景的原因与处理方式差 ...
2026-06-29在Excel数据统计、财务核算、销售复盘、库存盘点等办公场景中,经常需要在数据透视表中实现一列数据乘以另一列数据的计算需求, ...
2026-06-29在数据分析中,指标是连接业务与数据的核心语言。它并非一个简单的数字,而是一个将模糊的业务需求(如“提升用户粘性”)转化为 ...
2026-06-29【核心关键词】大数据、零售商、消费者、供应链、运营、企业、产品、客户、数据模型、大数据平台、数据开发、系统运维、业务逻 ...
2026-06-26在物流配送、供应链履约、终端供货等业务场景中,送货率是衡量企业履约能力、服务质量、供应链稳定性的核心业务指标,直接关联客 ...
2026-06-26 很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度” ...
2026-06-26在数字化管理与数据化运营体系中,指标是连接原始数据与业务决策的核心载体。零散的原始数据只是无意义的数值堆砌,无法直接反映 ...
2026-06-25在Excel数据汇总、财务统计、业务复盘等日常办公场景中,经常需要完成逐行相乘、整体汇总求和的计算需求,最典型的场景就是:单 ...
2026-06-25