京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代:大数据能做什么_数据分析师
7月28日,《大数据时代:生活、工作与思维的大变革》作者、牛津大学教授维克托·迈尔-舍恩伯格,参加了在青岛举行的2013年海尔商业模式创新全球论坛。论坛上,舍恩伯格纵论数据的价值、如何开发运用数据的价值,以及未来大数据时代将带来的经济模式变革。
要学会善用更多的数据
在过去的十多年中,互联网的广泛应用,极大降低了交易成本。但在舍恩伯格看来,另外一场革命即将到来,就是大数据时代带来的革命。
他举例说,一位华盛顿大学计算机系教授创办的大数据企业,到所有电子商务公司抓取数据,“他可以抓取100万家电产品的价格数据,他每天都抓这些数据,来预测每一个家电产品在未来一到两周的价格走向。你要买一台洗衣机,上这个网站找到要购买的型号,网站就会告诉你这台洗衣机的价格在未来一周上升还是下降,用户可以根据这一走势决定现在就购买还是再等一等。”如果消费者根据他们的预测购买,但是多付了钱,企业愿意补差价。用户通过该公司的这种服务,每台家电平均可以节省102美元。
舍恩伯格说,现在有越来越多的数据,人们可以收集、分析与所要研究的问题相关的更多信息。通过这些数据,人们能够得到很多的洞识,帮助他们做出选择、决策。“只有你分析了所有相关现象、所有的数据,或者大多数的数据,才能看到没有看到的一些问题和选择。所以我们要学会善用更多的数据。”他还明确指出,大数据时代最大的转变就是,放弃对因果关系的渴求,取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新挑战。
他举例,早产儿非常容易感染,往往在他们感染之后再发现就太迟了。而多伦多的一些研究人员用了一些特殊的传感器收集早产儿的生命体征,一秒钟就能收集1200条数据,然后再积累大量早产儿的数据,对这些数据进行相关性分析。通过这些分析,他们发现可以提前24小时发现感染迹象,从而拯救婴儿生命。“通过采取措施,早产儿的死亡率大大减少,这就是一个非常实际的例子,大数据能帮我们做什么。对于早产儿的例子我们不知道为什么,但是我们知道是什么,这已经够了,因为这已经能够帮助我们救这些孩子的命了。”
数据的价值在改变
对于商业来说,大数据能做些什么呢?舍恩伯格认为,关键的一点是数据的价值在改变。“以前的小数据时代,数据的价值是它一次使用的价值,收集使用一次之后就没了用处。但未来数据的真正价值在于可以一而再、再而三地使用。数据的再使用更加重要。”
沃尔玛是世界上最大的零售商,有着实体店最大的数据库。他们会记录每一笔交易,然后把这些交易的数据存在电脑中。几年前,沃尔玛的大数据部门进行了一些数据分析,发现在热带风暴来临之前,手电筒和电池的销售会上升,这并不让人奇怪。但与此同时他们也发现,一种叫做poptarts的食物销售也会随之上升。“他们不知道为什么,但他们不在乎。他们在乎的是,把这种食物放在收银台旁边,同手电筒和电池放在一起,大大提升了它们在飓风来临前的销售量。”
inrix是一个西雅图的公司,该公司用实时的交通流量数据来帮助人们躲避交通堵塞。它给人们展示实时地图,告诉人们什么地方最堵。它的数据来源不是别的,而是每一个该公司产品的用户,与此同时也成为他们的一个传感器。“用户把他的车速数据传给inrix,inrix有1亿个用户就有1亿个传感器,每天搜集的数据是40亿,对于美国的交通状况一目了然。也就是说这个数据取之于民、用之于民”。Inrix公司甚至还预见到了2009年美国的经济衰退,因为交量有所减少或急剧下降,所以就预测到了美国的经济要衰退。现在有很多的对冲基金也使用了inrix的数据,因为他们发现那些购物中心在周末的交通量和他们的销售额有紧密联系。“所以inrix通过大数据的分析和重复使用,创造了巨大的价值。”
大数据离我们有多远
舍恩伯格断言:“目前席卷全球的一个趋势,就是企业从原来的生产制造的思维方式转为把自己视作一个数据平台。”
在他看来,谷歌公司深刻理解了这个趋势。谷歌开发了一种无人驾驶汽车,这种汽车专门收集街景,还可以通过雷达来收集道路信息,如交通信号灯的频率,还有手机信号信息和wifi供应商的信息。“因为谷歌完全理解这个车就是一个数据收集的平台,而且这些数据不仅仅是为了提供街景,而是更好地来改善服务,可以更好地改善安卓的手机定位,这样一来,即便手机没有GPS信号也可以精确地定位。也可以更好地给谷歌正在开发的无人驾驶汽车提供导航。随着数据量的增加,他们肯定可以在这个平台上确立自己的霸主地位。而它将影响的下一个行业就是汽车行业。”
“未来竞争优势将来自于何处呢?不一定来自于制造,而是来自于数据,还有收集、分析和使用数据的能力。”舍恩伯格认为,大数据时代,那些能够提供功能最为丰富、数据量最大的数据平台的公司将在竞争中获胜。
“家电行业如果有谁能够做到这一点的话,肯定能获得成功。”舍恩伯格对海尔近年来打造的人单合一双赢模式以及在这一模式下开展的平台组织创新十分看好,认为海尔已经占据了大数据时代的先机。“相信海尔在这个时代具有巨大的优势和机会,可以成为全世界大数据的领导者去创造丰富的大数据生态圈。”
“大数据带来的信息风暴正在变革我们的生活、工作和思维,大数据开启了一次重大的时代转型。”舍恩伯格说,“对于大数据时代,我们要有大数据的头脑和理念,要有一个正确的心态来去理解这些大数据的价值,对企业、对商业生态圈、对社会来说都是一样的。”
人物简介 维克托·迈尔-舍恩伯格
《大数据时代:生活、工作与思维的大变革》是国外大数据系统研究的开先河之作,作者维克托·迈尔-舍恩伯格是最早洞见大数据时代发展趋势的数据科学家之一,也被誉为“大数据时代的预言家”。早在2010年,他就在《经济学人》上发布了长达14页对大数据应用的前瞻性研究。
舍恩伯格现任牛津大学网络学院互联网治理与监管专业教授,并担任耶鲁大学、芝加哥大学等大学的客座教授。他的咨询客户包括微软、惠普等全球顶级企业,他也是众多国家政府高层的信息政策智囊,他还是世界经济论坛、马歇尔计划基金会等机构的咨询顾问。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01在数据驱动决策的时代,企业与从业者每天都会面对海量数据——电商平台的用户行为数据、金融机构的信贷风险数据、快消品牌的营销 ...
2026-04-01在数字化转型的浪潮中,企业数据已从“辅助运营的附属资源”升级为“驱动增长的核心资产”,而一套科学、可落地的企业数据管理方 ...
2026-04-01在数字化时代,每一位用户与产品的交互都会留下可追溯的行为轨迹——电商用户的浏览、加购、下单,APP用户的注册、登录、功能使 ...
2026-03-31在日常数据统计、市场调研、学术分析等场景中,我们常常需要判断两个分类变量之间是否存在关联(如性别与消费偏好、产品类型与满 ...
2026-03-31在CDA(Certified Data Analyst)数据分析师的职场实战与认证考核中,“可解释性建模”是核心需求之一——企业决策中,不仅需要 ...
2026-03-31多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30在TensorFlow深度学习实战中,数据集的加载与预处理是基础且关键的第一步。手动下载、解压、解析数据集不仅耗时费力,还容易出现 ...
2026-03-30