京公网安备 11010802034615号
经营许可证编号:京B2-20210330
政府开放大数据,规则界定前大公司优先
大数据终于不再是纸上谈兵,而是进入到实际应用阶段,标志性事件是两会上,李克强总理明确表态,政府应该尽量的公开非涉密的数据,以便利用这些数据更好的服务社会,也为政府决策和监管服务。这是中国政府首次正式公开表态支持大数据。
在此之前中国各级政府一些部门已在大数据开放上有所尝试,从实际情况来看,还存在开放规则不明朗的问题,不过一个大方向确实:大公司优先。
政府部门大数据成为企业眼里的“香饽饽”
大数据是金矿,企业和政府都已经意识到其中的价值,在大数据上有野心的企业都期望获得更多有价值的数据,可能是来自其用户,可能是来自合作伙伴,还有一个重要来源是政府等组织机构的公开数据。 不同来源不同性质的数据关联在一起交叉挖掘分析,会发生“化学反应”得到更多价值。阿里巴巴拿到微博数据可以挖掘做好精准营销、拿到交通部门数据可以与菜鸟网络结合、拿到金融监管部门数据便可与用户交易和理财记录结合做个人征信;百度拿到交通部门数据可以与百度地图结合、拿到博彩指数公司数据结合网络数据做世界杯预测……
2015年开始中国政府对互联网、高科技和大数据产业的空前重视,并且明确表态要开放大数据,因此势必会有更多的政府数据开放给民间。这些大数据成为相关企业眼里的“香饽饽”。这些数据如何开放、开放给谁、如何使用,却还不明朗。
政府大数据使用权尚不明朗,需边走边看
阿里、百度这两家中国最积极的大数据玩家,过去便与一些政府部门接入了大数据。
2013年2月25日,国家食品药品监督管理局与百度在北京联合举行“安全用药,搜索护航”战略合作签约仪式。国家药监局的三大药品数据库,总计20余万个权威药品信息全面入驻百度。
2014年5月27日,中国气象局公共气象服务中心与阿里云达成战略合作,共同搭建“中国气象专业服务云”,面向有气象数据需求的企业提供专业化的云计算服务。
2014年7月23日,百度推出名为“北京健康云”的智能医疗平台产品,这是北京市政府支持推动下的一个民生医疗项目。
2014年10月15日,“云上贵州”系统平台正式开通运行,这是贵州省政府与阿里牵头的企业合建的云计算基础设施,应用在交通等领域。
2015年1月13日,阿里健康宣布将药品监管网的基础设施从甲骨文数据库迁移到阿里云平台,阿里将利用大数据技术帮助解决假药问题。
政府在大数据上已经动了起来,百度和阿里成为第一批吃螃蟹者。问题是,这些数据不只是它们想要,阿里和百度之间有竞争关系不说,还有不少相关企业都有拿到这些数据的诉求。 比如药监局的药品数据库,百度和阿里先后拿到之后,便有医学药学生命科学专业网站“丁香园”站出来表示,这些数据应该以公平的方式开放给更多企业,以达到数据安全,市场公平和效率最高的目的。显然在纷纷认识到大数据的重要性之后,围绕大数据的争抢已经展开。
美国政府在大数据开放上有着先进的经验,《大数据》这一大数据启蒙教材的主要案例便是围绕美国政府大数据的开放案例,这本书曾被副总理汪洋公开推荐给官员。“用纳税人的钱收集的数据应该免费提供给纳税人使用”书中提及的一个观点。
不过,道理简单,操作却并不可一蹴而就:哪些数据是可以开放的(李克强总理提到非涉密数据,不知道是否已有明确界定规则)?开放的程度是怎样的?开放的方式如何:是面向特定企业开放还是建设系统纳入统一数据开放平台之中?是有偿开放给企业还是免费开放给所有企业?是直接开放原生数据还是开放基于数据挖掘的某些统计结果?显然,这些问题都没有统一答案,需要边走边看。
规则界定之前,政府开放大数据更倾向于“大公司优先”
政府开放大数据当前的案例主要是面向阿里、百度这样的互联网巨头。在一些中小创业型公司看来,这难免会有些“不公平”。不过仔细想想,大公司优先或许是必经之路。
首先,大公司具有更强的技术能力和资源。阿里巴巴给外界的印象是电商,其实它同时也是技术大牛,阿里云是最大的公有云平台,并且其面向大数据推出了ODPS(开放大数据处理服务)。同样,百度是技术驱动的互联网巨头,率先提供了大数据开放引擎,建立了大数据实验室。在这两家公司大数据已经是公司战略。它们有技术,肯投入资源利用大数据。如果说只能逐步开放大数据给不同企业,分批选择企业有限选择技术更强、资源更多的大公司合情合理。
其次,大公司在大数据隐私保护上更可靠。由于政府大数据不少涉及到国计民生,不少关乎公民隐私,比如健康数据、出行数据、信用数据等等。因此政府在开放大数据服务于民的同事,必须严格把关数据的使用者以及使用方式,避免出现公民隐私被侵犯的情况。如果不涉及公民隐私的数据直接开放自然没问题,但涉隐数据,自然要选择可靠的使用者。从概率上来看,声誉好的大公司出现问题的概率最小。这与普通用户选择个人云存储、个人邮箱、网络支付工具等涉及隐私服务,会优先考虑大公司,是一个道理。
再次,面向中小企业的数据开放必须通过系统。就算政府一些数据可以公开给任何符合条件的企业使用,也不大可能是“点对点”的方式,即不是签协议战略合作这类方式,而是基于开放式的数据开放平台,可能是公共API,也可能是美国政府的“DATA.GOV”这样的形式,只有这样才能一次开放多家使用。谈判、合作、协商、协议,这些都只适合针对个别企业的合作。因此眼下这样的可以整合不同政府部门相关数据的开放平台建设,已迫在眉睫。不过在建好之前,只能是大企业优先,与大企业的合作只会为后续的进一步开放提供宝贵的实践经验。
最后,大企业并非无偿使用数据还要贡献价值。还有一个重要的原因是,BAT等大企业本身便拥有海量大数据。这些数据来自中国网民的网购理财、来自用户社交搜索等等。2014年9月19日,国家统计局首次对外展示了其正在研究的基于百度搜索数据来预测房地产价格的新工具,以及新研发的网购数据统计,而其数据来源之一则是阿里巴巴。腾讯也在统计局的潜在数据源提供方名单之中。就是说,政府一方面要开放自己的大数据,另一方面也需要从大公司拿到特定数据。除了数据贡献之外,还有技术服务。政府不擅长技术,BAT们却擅长,帮助政府部门建基础设施、建开放平台、开发数据挖掘工具,在这一块的合作案例已经够多了。
从长远来看,政府开放大数据是必然趋势,取之于民用之于民。不过全面开放、完善开放规则还需要一个过程。在当前的个例式开放模式中,政府部门似乎更倾向于“大公司优先”。我想这只是暂时的,未来更多中小企业、以及政府所鼓励的创业者,都会享受到“大数据红利”,现在还需要多一点耐心。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04