京公网安备 11010802034615号
经营许可证编号:京B2-20210330
互联网最尖端的竞争集中在大数据
2015中关村大数据日的峰会上,中国科学院院士张平文举了一个有趣例子:前一阵,他有家人甲状腺不适,院士有天晚上查了甲状腺知识,第二天就收到微信好友申请,有专治甲状腺的医生想加他为好友,院士感概说,“没有人怀疑我们就生活在大数据时代,”
2015年以来,从“大众创业、万众创新”,一直到“互联网+”以及大数据发展行动纲要,国家利好政策不断,行业领军者开拓创新,中国大数据产业群正快速形成,大数据在交通、工业、社交等领域的应用也日新月异。大数据,正在开启一个认知的新时代,这是一座新的商业宝藏,也正酝酿着一场全新的较量。
“最尖端的竞争”
过去3年,打车应用真正改变了大众出行,滴滴快的CEO程维在大数据日峰会分享说,“中国80%的出租车司机通过滴滴连接在一起,又顺势推出了滴滴专车、快车、顺风车、巴士等系列新业务,希望将有相同出行需求的人连接在一起,实现任何人在任何时间、任何地点在3分钟内叫到一辆车。”
美好的愿景完全依赖于大数据的支持。直到现在,程维依然清晰地记得一宗“事故”:2013年有一次北京大雨,CBD国贸地区用户打不到车,滴滴技术团队梳理订单后发现,绝大多数的订单根本发不出去,“我们最初德尔大数据算法是将一个订单发给附近1-3公里的司机,在订单非常多的时候,司机信道变成稀缺资源,就无法接到更多的订单。”
程维很快发现,当一个城市日均订单超过1万单后,原始的大数据算法即成为瓶颈,于是,滴滴将建设中国最好的大数据团队当成公司战略,为实现用户和司机的快速匹配,迄今后台已经多个版本的大数据结构和算法。
大数据在交通的应用,并不限于打车。构建了完整大数据产业平台的北京久其软件公司,曾为江苏省提供智能化交通统计监测系统,将所有江苏省内高速出入口的视频以及海运、河运、港口等所有的音视频的数据全部纳入体系,进行实时监控。久其软件副总裁钱晖分享说,“在江苏省内,如果你的车被偷或者号牌模糊,系统在一秒钟之内就能实现号牌识别。”
钱晖表示,智慧交通系统积累的数据,服务范围不限于交通,比如经济学有所谓“克强指数”(即以工业用电量新增、铁路货运量新增和银行中长期贷款新增的数据,评判GDP的增长),利用智能系统可以监测高速公路出入口大货车的运量,分析实体经济状况,用于经济决策。
提供便利的同时,大数据交通云的难度和复杂度,也远超过一般人的想象。以江苏省的智能交通系统为例,实现数据实时入库、动态更新以及查询,数据量非常大,每年要更新12亿条以上的信息量。
程维认为,交通大数据能力的构建,其复杂程度甚至超过搜索,他将其总结为三大特点:实时性,每过1分钟交通情况以及车的位置都会发生变化;双向互动,需求方用户和供给方司机相互影响,除了满足用户,系统要根据司机喜好推荐最好的订单;集群扰动,比如,100个人或10000人搜索,结果不会有什么区别,但是10个人还是200人一起叫车,运算结果完全不同,“滴滴代表的交通云,涉及深度学习、人工智能等技术前沿,令云平台更智能、更高效,这是公司最重要的事情。”
“互联网的竞争,已从早期的产品竞争、营销竞争、资本竞争,实实在在进入云端、大数据端的竞争,”程维表示,“全球大的互联网出行领域,最尖端的竞争就集中在大数据领域。”
占据技术制高点的背后,是顶尖人才的争夺。滴滴的全球竞争对手,几乎早于他们动手前的半年,就开始收罗全球顶尖大学的大数据研究人员,从主任、专家到一线工作人员,几乎一网打尽,甚至有公司专门派一支队伍在MIT实验室旁蹲守两个月,“先从副主任挖起,再找主任,一个带一个把30多个实验室的人彻底挖空。”
关键在顶层设计
6年前即深耕工业大数据,美林数据总裁王璐深有感触,“大数据对整个工业带来的冲击是太大太大了”,而美林只专注两件事:工业大数据中心的建设以及对数据的分析、挖掘、高维可视化。“‘两化融合’核心是什么?我们认为是数据的管理,只有在工业4.0时代,才实现了‘两化’的强连接,代表工业化和信息化高度嵌入到一个整体系统。”
在王璐看来,大数据时代,就是会用数据说话、决策、管理、创新,如今,整体氛围和思维方式的条件已具备,核心在于大数据技术的挑战,其中,首要的挑战在于组织的顶层设计,“美林帮助很多企业进行顶层设计,两化融合和大数据融合的战略需要复杂组织系统的设计,尤其是数据管理的长效机制,其中,流程和组织最直接的挑战,就是寻找一批懂业务、懂数据还懂分析的人才队伍。”
国家电网信通部主任王继业在峰会分享了其基于顶层设计、布实施后的运营实践。在大数据方面,国家电网首先规划建立了企业级大数据平台,通过大数据平台实现数据的采集、传输以及存储和处理;在大数据平台之上建立决策支持类、实施采集类、在线监测类、计算分析类等大数据业务应用,其中分成10大场景,在不同单位进行相应试点工作。
以电力负荷预测为例,国家电网组织了江苏电力、山东电力两家地区公司,利用大数据技术,基于电力负荷用户档案数据,结合气侯、气温变化等数据,建立用电数据分析模型,实现用电负荷特性分析并且预测未来用点负荷曲线。
比如,江苏电力就构建了数百个分析模型,在2015年4月对于全省的电力用电高峰进行了预测,其判断用电高峰出现在8月6号,预测最高电量为8481万千瓦时,结果,真正出现时间是8月5号,仅仅差一天,而实际发生的最高值为8440万千瓦时,误差率非常之低。
王继业表示,基于顶层设计、有序推进,大数据带来的威力十分之大,国家电网也尝到了甜头,“通过前期试点,负荷预测准确率提高到99.5%,最高负荷发生时间偏差1天,峰谷差率下降了5%;对配电网抢修精益化大数据预测,实时监测、故障预测、抢修达标率析,设备故障预测准确率提升40%,抢修达标率达到15%,抢修时长缩短30分钟。”
事实上,不只工业领域,响应整个社会大数据化,凝聚共识,全力推动大数据产业创新发展,形成政府、社会、市场共同推动、联合治理的发展格局,一样需要顶层设计;而商业公司内部的许多数据,若能在一套规则清晰的制度下进行共享,完全可以应用到宏观经济和社会管理,实现数据价值的最大化。
龙信数据董事长李钰就认为,应用是衡量数据价值唯一标准,龙信即将发布的是中关村企业大数据平台,可记录北京市百万家企业每天的动态的经营和税收情况,可以洞悉全国5千万市场主体与宏观经济内在关系,有百亿的节点在秒级可以进行运算,有深度学习能力,是未来企业数据的智慧大脑,这对于宏观经济决策一样极具价值。
LinkedIn全球副总裁Michael Korcuska在峰会分享了过去3年的领英(LinkedIn)数据积累,也有非常有趣的洞察:基于中国强劲的经济增长,越来越多的人才从全球来到中国,其核心技能主要是经济学、统计分析、化学、社交媒体等领域,而部分离开中国的人士,其所擅长的是城市规划、海洋、导航、水库管理以及传统中医等。Michael Korcuska建议,利用领英的职位数据库,政府可以做两件事:为稀缺人才提供激励机制,与大学合作培养针对性的人才。
峰会最后,宽带资本董事长田溯宁以独有的历史视角,对于大数据应用的前景进行了展望。他认为,人类历史上曾有地理大发现的时代,发现新大陆改变了人类的时空观念,开启了工业革命,而现在,人类社会正迈入“一个数据大发现的时代”,将开启无限的新机会。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27在数字化时代,企业积累的海量数据如同散落的珍珠,若缺乏有效的梳理与分类,终将难以发挥实际价值。CDA(Certified Data Analys ...
2026-02-27在问卷调研中,我们常遇到这样的场景:针对同一批调查对象,在不同时间点(如干预前、干预后、随访期)发放相同或相似的问卷,收 ...
2026-02-26在销售管理的实操场景中,“销售机会”是核心抓手—— 从潜在客户接触到最终成交,每一个环节都藏着业绩增长的关键,也暗藏着客 ...
2026-02-26在CDA数据分析师的日常工作中,数据提取、整理、加工是所有分析工作的起点,而“创建表”与“创建视图”,则是数据库操作中最基 ...
2026-02-26在机器学习分析、数据决策的全流程中,“数据质量决定分析价值”早已成为行业共识—— 正如我们此前在运用机器学习进行分析时强 ...
2026-02-25在数字化时代,数据已成为企业决策、行业升级的核心资产,但海量杂乱的原始数据本身不具备价值—— 只有通过科学的分析方法,挖 ...
2026-02-25在数字化时代,数据已成为企业核心资产,而“数据存储有序化、数据分析专业化、数据价值可落地”,则是企业实现数据驱动的三大核 ...
2026-02-25在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16