京公网安备 11010802034615号
经营许可证编号:京B2-20210330
政府开放大数据,规则界定前大公司优先
大数据终于不再是纸上谈兵,而是进入到实际应用阶段,标志性事件是两会上,李克强总理明确表态,政府应该尽量的公开非涉密的数据,以便利用这些数据更好的服务社会,也为政府决策和监管服务。这是中国政府首次正式公开表态支持大数据。
在此之前中国各级政府一些部门已在大数据开放上有所尝试,从实际情况来看,还存在开放规则不明朗的问题,不过一个大方向确实:大公司优先。
政府部门大数据成为企业眼里的“香饽饽”
大数据是金矿,企业和政府都已经意识到其中的价值,在大数据上有野心的企业都期望获得更多有价值的数据,可能是来自其用户,可能是来自合作伙伴,还有一个重要来源是政府等组织机构的公开数据。 不同来源不同性质的数据关联在一起交叉挖掘分析,会发生“化学反应”得到更多价值。阿里巴巴拿到微博数据可以挖掘做好精准营销、拿到交通部门数据可以与菜鸟网络结合、拿到金融监管部门数据便可与用户交易和理财记录结合做个人征信;百度拿到交通部门数据可以与百度地图结合、拿到博彩指数公司数据结合网络数据做世界杯预测……
2015年开始中国政府对互联网、高科技和大数据产业的空前重视,并且明确表态要开放大数据,因此势必会有更多的政府数据开放给民间。这些大数据成为相关企业眼里的“香饽饽”。这些数据如何开放、开放给谁、如何使用,却还不明朗。
政府大数据使用权尚不明朗,需边走边看
阿里、百度这两家中国最积极的大数据玩家,过去便与一些政府部门接入了大数据。
2013年2月25日,国家食品药品监督管理局与百度在北京联合举行“安全用药,搜索护航”战略合作签约仪式。国家药监局的三大药品数据库,总计20余万个权威药品信息全面入驻百度。
2014年5月27日,中国气象局公共气象服务中心与阿里云达成战略合作,共同搭建“中国气象专业服务云”,面向有气象数据需求的企业提供专业化的云计算服务。
2014年7月23日,百度推出名为“北京健康云”的智能医疗平台产品,这是北京市政府支持推动下的一个民生医疗项目。
2014年10月15日,“云上贵州”系统平台正式开通运行,这是贵州省政府与阿里牵头的企业合建的云计算基础设施,应用在交通等领域。
2015年1月13日,阿里健康宣布将药品监管网的基础设施从甲骨文数据库迁移到阿里云平台,阿里将利用大数据技术帮助解决假药问题。
政府在大数据上已经动了起来,百度和阿里成为第一批吃螃蟹者。问题是,这些数据不只是它们想要,阿里和百度之间有竞争关系不说,还有不少相关企业都有拿到这些数据的诉求。 比如药监局的药品数据库,百度和阿里先后拿到之后,便有医学药学生命科学专业网站“丁香园”站出来表示,这些数据应该以公平的方式开放给更多企业,以达到数据安全,市场公平和效率最高的目的。显然在纷纷认识到大数据的重要性之后,围绕大数据的争抢已经展开。
美国政府在大数据开放上有着先进的经验,《大数据》这一大数据启蒙教材的主要案例便是围绕美国政府大数据的开放案例,这本书曾被副总理汪洋公开推荐给官员。“用纳税人的钱收集的数据应该免费提供给纳税人使用”书中提及的一个观点。
不过,道理简单,操作却并不可一蹴而就:哪些数据是可以开放的(李克强总理提到非涉密数据,不知道是否已有明确界定规则)?开放的程度是怎样的?开放的方式如何:是面向特定企业开放还是建设系统纳入统一数据开放平台之中?是有偿开放给企业还是免费开放给所有企业?是直接开放原生数据还是开放基于数据挖掘的某些统计结果?显然,这些问题都没有统一答案,需要边走边看。
规则界定之前,政府开放大数据更倾向于“大公司优先”
政府开放大数据当前的案例主要是面向阿里、百度这样的互联网巨头。在一些中小创业型公司看来,这难免会有些“不公平”。不过仔细想想,大公司优先或许是必经之路。
首先,大公司具有更强的技术能力和资源。阿里巴巴给外界的印象是电商,其实它同时也是技术大牛,阿里云是最大的公有云平台,并且其面向大数据推出了ODPS(开放大数据处理服务)。同样,百度是技术驱动的互联网巨头,率先提供了大数据开放引擎,建立了大数据实验室。在这两家公司大数据已经是公司战略。它们有技术,肯投入资源利用大数据。如果说只能逐步开放大数据给不同企业,分批选择企业有限选择技术更强、资源更多的大公司合情合理。
其次,大公司在大数据隐私保护上更可靠。由于政府大数据不少涉及到国计民生,不少关乎公民隐私,比如健康数据、出行数据、信用数据等等。因此政府在开放大数据服务于民的同事,必须严格把关数据的使用者以及使用方式,避免出现公民隐私被侵犯的情况。如果不涉及公民隐私的数据直接开放自然没问题,但涉隐数据,自然要选择可靠的使用者。从概率上来看,声誉好的大公司出现问题的概率最小。这与普通用户选择个人云存储、个人邮箱、网络支付工具等涉及隐私服务,会优先考虑大公司,是一个道理。
再次,面向中小企业的数据开放必须通过系统。就算政府一些数据可以公开给任何符合条件的企业使用,也不大可能是“点对点”的方式,即不是签协议战略合作这类方式,而是基于开放式的数据开放平台,可能是公共API,也可能是美国政府的“DATA.GOV”这样的形式,只有这样才能一次开放多家使用。谈判、合作、协商、协议,这些都只适合针对个别企业的合作。因此眼下这样的可以整合不同政府部门相关数据的开放平台建设,已迫在眉睫。不过在建好之前,只能是大企业优先,与大企业的合作只会为后续的进一步开放提供宝贵的实践经验。
最后,大企业并非无偿使用数据还要贡献价值。还有一个重要的原因是,BAT等大企业本身便拥有海量大数据。这些数据来自中国网民的网购理财、来自用户社交搜索等等。2014年9月19日,国家统计局首次对外展示了其正在研究的基于百度搜索数据来预测房地产价格的新工具,以及新研发的网购数据统计,而其数据来源之一则是阿里巴巴。腾讯也在统计局的潜在数据源提供方名单之中。就是说,政府一方面要开放自己的大数据,另一方面也需要从大公司拿到特定数据。除了数据贡献之外,还有技术服务。政府不擅长技术,BAT们却擅长,帮助政府部门建基础设施、建开放平台、开发数据挖掘工具,在这一块的合作案例已经够多了。
从长远来看,政府开放大数据是必然趋势,取之于民用之于民。不过全面开放、完善开放规则还需要一个过程。在当前的个例式开放模式中,政府部门似乎更倾向于“大公司优先”。我想这只是暂时的,未来更多中小企业、以及政府所鼓励的创业者,都会享受到“大数据红利”,现在还需要多一点耐心。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16