京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据垄断怎么破
永恒的是变化本身。最新例子是,数据已类似石油和电力,成为世界上关键的战略性基础资源。
两会议程过半,大数据开放成了热门词。这一热点背后,是中国大数据发展处在起步阶段,不少基础性、关键性数据仍被众多部门和机构束之高阁,少数大型互联网垄断企业为追求利益最大化,以安全和企业机密等原因拒绝向社会提供关键数据,整个国家数据共享开放程度不高。
“现阶段所存在的数据平台,主要以政府相关部门、大型互联网公司为主,具有较强的层级性、区域性和单一性,对于社会治理和企业发展的帮助极其有限。”全国人大代表、苏宁控股集团(苏宁)董事长张近东在一份关于数据共享的建议中如此表述。
张近东的建议是,建立国家级跨地域、跨行业的开放数据统一管理平台。全国人大代表、腾讯公司(腾讯)董事会主席兼首席执行官马化腾也持类似看法,他建议,实现数字资源整合,用好用满现有的数字基础设施,加快数字中国建设进程。
开放数据成为政策建议的热点背后,是互联网巨头凭借着数据优势,获得了特殊地位,从而谋得巨额利润。
正如《经济学人》在去年5月初发表的“监管数据经济”一文中指出,互联网公司对数据的控制,使之掌握了巨大权力,而这一权力,使得巨头的监控系统覆盖整个经济领域。“2018年,将是大数据从技术阶段向应用阶段高速发展的一年。大数据未来在物联网、区块链、智慧城市、AR、VR、AI、语音识别等领域都值得关注。”关于大数据潜力,张近东以书面形式如此回复经济观察报记者。
建议
政务大数据开放已在政策日程之中。
去年5月18日,国务院办公厅印发《政务信息系统整合共享实施方案》,方案指出, 推进政务信息化“五位一体”总体布局和协调推进“四个全面”战略布局,有效推进政务信息系统整合共享,切实避免各自为政、自成体系、重复投资、重复建设。
在前述方案中,还提出了包括消除“僵尸”信息系统、加快部门内部信息系统整合共享、提升国家统一电子政务网络支撑能力、接入统一数据共享交换平台、加快公共数据开放网站建设、推进全国政务信息共享网站建设等在内的“十件大事”。
此外,上述方案明确,要在今年6月底前,实现国务院各部门整合后的政务信息系统,统一接入国家数据共享交换平台,各地区结合实际,统筹推进本地区政务信息系统整合共享工作,初步实现国务院部门和地方政府信息系统互联互通。
工信部总工程师张峰在去年5月17日举行的“2017年世界电信和信息社会日”大会上提到,“中国将建设全国一体化的国家大数据中心,推进公共数据开放和基础数据资源跨部门、跨区域共享”。
政策暖风下,数据开放逐步指向社会数据。张近东建议,国家应加快顶层设计和统筹规划,中央政府牵头,参考银联、网联模式,以企业机构为建设和运营主体,将政府、社会的数据汇聚和管理,建立国家级的跨地域、跨行业的开放数据统一管理平台,为数据应用创造有利条件。
张近东还建议,把数据平台的建设作为重要公共基础设施,引导社会各行各业实现数据开放共享,对于数据资源的管理和供给,参考水电对于国家经济的基础,采取低价、充足的策略。
马化腾则更关注于公共数据的开放。他建议,充分利用现有数据平台,打破部门和地区壁垒,实现数字资源整合,同时,马化腾建议,借鉴国外先进经验,制定统一的公共数据开放规则。“在条件具备的部门或地区,示范建设公共数据开放平台和数据产品流转平台。可以在此基础上,进一步摸索出适合中国国情的公共数据开放战略。”
对于数据平台运营,马化腾亦提出了自己的想法。他建议,加强数据相关市场机制建设,维护健康有序的市场竞争秩序。“建立健全数据市场体系和交易机制,是发挥市场在数据要素配置过程中的主导作用的前提。”
纠葛
海量的数据变化改变了竞争。科技巨头始终受益于网络效应,例如,注册Facebook的用户越多,就越能吸引其他人注册。而这些数据又会构成额外的网络效应。通过收集更多的数据,企业便可改进自家产品,从而吸引更多用户,甚至生成更多数据。海量数据可以充当企业的护城河。
另一方面,数据也可以成为抵抗竞争对手的方式。在科技行业,人们之所以对竞争怀有期望,是因为某个创业公司可能击败老牌企业,也有可能出现意料之外的技术变革。但在数据时代,这两种可能性都大幅降低。
前述《经济学人》报道称,巨头的监控系统覆盖整个经济。比如,谷歌可以看到人们搜索什么,Facebook知道你在分享什么,亚马逊对你的购物习惯了如指掌。“他们拥有应用商店、操作系统,还向创业公司出租计算资源。他们可以监控自己的市场和其他市场。他们能够看到哪些新产品和新服务受到追捧,因而能够及时模仿,甚至直接收购,避免遭遇更大的威胁。”
张近东的建议背后,就是这一趋势的持续发展。他直指,应开放数据,让广大中小型企业,能够与部分已经具有领先优势的巨型企业,在数据领域站在同一起跑线上,“打破数据壁垒,杜绝数据垄断。”
对中小型企业,大数据确实起着重要作用。有零售行业创业者向记者坦言,想在这一行创业,只有去巨头们看不上的细分市场,“数据的事绕不开,所以只能打造小领域的小生态,我们有跟BAT谈过,目前保持独立,至于未来(是否接受巨头入股),也不知道。”
另一头,不惟中小型企业,巨头们亦为数据之战打得不可开交,去年中的“顺丰、菜鸟网络(菜鸟)之争”便是明证。
去年6月1日,菜鸟下线顺丰旗下快递柜系统丰巢的接口信息,同时,顺丰关闭了自提柜的数据信息回传。最终,在国家邮政总局的调节下,顺丰、菜鸟双方同意于6月3日12时起,全面恢复业务合作和数据传输。此次争议的焦点在于,顺丰指称菜鸟要求其提供非淘系(非阿里巴巴电商平台)数据;菜鸟方面则坚称,在过去的合作中,顺丰大量查询和使用丰巢中非顺丰的数据,远远超出了正常使用范围。
国金证券的一份报告就此分析,此次“丰鸟之争”的主要核心关键在于对数据的争夺。数据在未来,对于提升快递服务质量、提升快递企业盈利能力具有重要作用。”商业竞争的本质是供应链之争,而大数据的获取分析,是现代供应链竞争基础。 ”
行业内对于数据的敏感性,亦深有感触。去年11月,苏宁易购副董事长孙为民向经济观察报记者披露,苏宁物流与阿里在物流数据交互上有所保留。“数据的主体属于消费者自己,每一个企业或者说平台,都有相应的接口。把数据全都给他们(阿里),对消费者权益也是不尊重的。”
去路
基于上述种种原因,数据开放,渐成大势,但也面临着种种问题。
其中之一是,数据管理缺少规范和标准,同时,数据开放安全性存疑。张近东的建议是,展开数据领域的立法工作,通过人大立法机构,成立立法推进委员会,加快数据采集、开放、共享、安全、使用和隐私保护方面的立法,建立数据标准、界定数据边界,确实有效地建立数据领域的法制基础。“以法律的形式对平台数据进行分级的有效管理,并规范数据资源开放和共享的内容及形式,形成完善的综合治理体系,提供公平公正安全可靠的环境。”
张近东还提出,在共建社会数据开放共享平台的过程中,可以逐步加大引入人工智能和区块链技术,推动大数据与人工智能、区块链等新技术的融合,利用技术融合优势,提高对风险因素的感知、预测、防范能力。
另一头,对于可能存在的巨头数据“垄断”等问题,《经济学人》指出,反垄断官员可以通过企业的数据资产来评估交易影响。“交易价格也会成为一个信号,帮助其判断老牌企业是否在通过收购排除威胁。”
此外,降低在线服务提供商对数据的控制权,让数据提供者掌握更大的控制,强迫企业向消费者披露他们所拥有的数据,以及他们借此获取的收入等。亦是《经济学人》的建议之一
值得一提的是,已有企业在数据开放中看到商机。全国政协委员、京东集团(京东)董事局主席兼首席执行官刘强东就建议,推进政府采购全流程电子化,提升政府采购效率和透明度、发挥大数据技术辅助决策作用,提升政府采购决策水平、加强与电商大数据对接,完善现代化监管手段。
京东本身亦在政府采购中收获颇丰。京东企业购官网显示,京东企业采购业务陆续达成了与中央政府采购、江苏省政府、广东省政府、北京市政府、上海市政府等众多大型政府和企业的采购合作,截止2016年底,京东平台现有活跃企业客户数超600万。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26表格结构数据以“行存样本、列储属性”的规范形态,成为CDA数据分析师最核心的工作载体。从零售门店的销售明细表到电商平台的用 ...
2025-11-26在pandas数据处理工作流中,“列标签”(Column Labels)是连接数据与操作的核心桥梁——它不仅是DataFrame数据结构的“索引标识 ...
2025-11-25Anaconda作为数据科学领域的“瑞士军刀”,集成了Python解释器、conda包管理工具及海量科学计算库,是科研人员、开发者的必备工 ...
2025-11-25在CDA(Certified Data Analyst)数据分析师的日常工作中,表格结构数据是最常接触的“数据形态”——从CRM系统导出的用户信息表 ...
2025-11-25在大数据营销从“粗放投放”向“精准运营”转型的过程中,企业常面临“数据维度繁杂,核心影响因素模糊”的困境——动辄上百个用 ...
2025-11-24当流量红利逐渐消退,“精准触达、高效转化、长效留存”成为企业营销的核心命题。大数据技术的突破,让营销从“广撒网”的粗放模 ...
2025-11-24在商业数据分析的全链路中,报告呈现是CDA(Certified Data Analyst)数据分析师传递价值的“最后一公里”,也是最容易被忽视的 ...
2025-11-24在数据可视化实践中,数据系列与数据标签的混淆是导致图表失效的高频问题——将数据标签的样式调整等同于数据系列的维度优化,或 ...
2025-11-21在数据可视化领域,“静态报表无法展现数据的时间变化与维度关联”是长期痛点——当业务人员需要分析“不同年份的区域销售趋势” ...
2025-11-21在企业战略决策的场景中,“PESTEL分析”“波特五力模型”等经典方法常被提及,但很多时候却陷入“定性描述多、数据支撑少”的困 ...
2025-11-21在企业数字化转型过程中,“业务模型”与“数据模型”常被同时提及,却也频繁被混淆——业务团队口中的“用户增长模型”聚焦“如 ...
2025-11-20在游戏行业“高获客成本、低留存率”的痛点下,“提前预测用户流失并精准召回”成为运营核心命题。而用户流失并非突发行为——从 ...
2025-11-20