京公网安备 11010802034615号
经营许可证编号:京B2-20210330
现阶段我国大数据共享面临的问题
国务院《促进大数据发展行动纲要》提到,推动政府信息系统和公共数据的互联共享,避免重复建设和数据打架,增强政府的公信力,促进社会信用体系建设。
大数据共享包括政府部门之间的数据共享、跨行政区域政府间的信息共享、政府与企业间数据的合作和共享、企事业单位之间的数据共享等。
政府层面,需要设立大数据协同管理机构,促进政府部门间的数据共享,但是必须要健全大数据相关制度框架和制度体系。另外,需要进一步建立基础数据库,一方面要集中存储被共享的数据,同时进行清晰校验和整合,提供可以共享的目录,以便用户可以接入和收取这些数据。当然,还要规定访问的权限和进行灾备等。
中国政府数据开放平台分布较不均衡,其中沿海经济发达地区占总数的70%,西部中部比较少。虽然中国政府开放了教育、医疗、文体、环境等方面的数据,但是开放数据的总量偏低、结构化程度低、数据质量不高、民众参与反馈不准。
数据共享和开放现在面临三大挑战:第一,不愿意共享开放,政府部门各自为政、把数据开放当成自己的权利。第二,法律法规制度不够具体,不清楚哪些数据可以跨部门共享和向公众开放。第三,缺乏公共平台,共享渠道不畅。
大数据的流通与交易
数据有提供方和使用方,很多时候,数据需要通过中介方进行交易。政府开放的数据是脱敏以后的原始数据,数据挖掘公司将政府数据加工后出售给数据使用方、行业户。一般来讲,数据生产者很少直接面向最终用户,大多通过中介渠道实现自身数据的变现。
大数据交易的关键是对数据质量的要求,包括数据的准确性、真实性、完整性、一致性等。关于交易数据合法性、及时性、可用性、安全性等问题,都是现阶段我国数据交易所面临的问题。
政府的数据不存在提供给中介方交易的问题,当然,中介方可以收集政府的数据进行加工。运营商收集的用户数据原则上所有权是用户,BAT收集的数据原则上所有权是用户,但是运营商和BAT拥有对数据脱敏及挖掘分析后加工数据的所有权。有数据的公司通过数据挖掘向政府和企业提供咨询报告,这类公司虽然没有数据所有权,但是有数据挖掘能力;而那些没有数据,但是有数据挖掘能力的公司,可以受委托完成数据挖掘。是否允许前者在保护隐私和国家安全的情况下提供数据,是否允许后者受委托进行数据挖掘后利用数据为非委托方服务,这些问题现在还没有明确规定。
此外,没有数据也没有挖掘能力的公司,可以作为中介平台,但是是否可以允许其截留数据呢?中介方收集了政府开放的数据据为己有并且出售是不是合法?因此,关于在数据源的稳定性、更新频率和数据扩散等方面,也需要相关规定给出明确的界限。
精加工的数据、可视化的数据怎么定价,怎么衡量数据挖掘的工作量,一次性买断的数据和可以重复多次出售的数据怎么定价,数据的价值与时效性有什么关系,是不是需要有对数据评估的第三方机构,都是现阶段国内数据流通和交易存在的问题。
政府和企业组织没有充分认识到用外部数据可以对自身工作和业务起到巨大的提升作用,所以,一般来讲都很少利用外部数据。很多数据拥有者对数据蕴含的价值缺乏足够的洞察,不放心让自己的数据进入流通环节,担心企业机密泄露。所以,流通也不够,交易也不够,利用更不够。
大数据利用和保护
目前,欧盟制定了严格的数据保护法案,中国虽然有宏观上的数据保护要求,但是没有全面的数据保护法规。
多元数据是跟个人隐私、专业、公共生活有关的任何信息,包括姓名、照片、电子邮件地址、工作表现、经济状况、健康状况、个人偏好、兴趣、IP地址等。针对个人信息的收集、记录、组织、建构、存储、修改、咨询、使用、传播和其他应用,包括排列组合,都可以通过人工处理或自动化处理。
个人具有管理自己数据的权益,具有自己的数据被泄露能够获得及时通知的权利以及被遗忘权。对个人数据处理,要合法公正透明,必须有规有法。只有为了公共利益或历史研究,个人数据才能长时间存储,其他目的个人数据不能长时间存储。同时,还要保证收集的个人数据有技术措施保证,不能被非法授权、非法处理、遗失丢失和损毁。
并不是说个人数据不能处理,符合规定的可以处理,例如本人同意可以作为一个或多个特定目的的数据。个人数据处理是为了保护自己,保护一个自然人的切身利益;为了公共利益,为了追求合法利益的必要,允许商业利用。商业部门、企业处理个人数据,首先是为了合法利益,当然不能侵犯提供个人信息数据的消费者的利益,尤其是儿童。现在几乎所有APP都收集个人信息,如果是为了合法利益的,是被允许的。有个社会调研,关于是否愿意为了将来应用资费上的优惠牺牲隐私,全球有27%的人表示可以牺牲隐私,中国有38%的人表示可以牺牲隐私,更多中国人认为隐私不重要,反而优惠更重要。
数据的传输存储和开发要有要求。所有的软件,包括移动应用的APP,在开发阶段和运行数据处理阶段要保护个人数据的隐私。数据控制也含APP,要有充分的技术和措施,确保数据和移动应用的完整性,必须应对数据处理面临的风险。
我国有一些关于数据开发应用的文件,工信部出台的“大数据产业发展规划”,2016年出台的“网络安全法”,都提到对个人信息和重要数据的境内存储,需要保护信息安全和个人隐私。但是,跟欧盟的法规比,我们的规范都很宏观,真正违反了会怎么样,并没有规定。
数据的价值在于融合与挖掘,政府数据对公众的最大利益在于共享与开放。数据流通与交易有利于促进数据的融合挖掘。数据的使用必须面对保护的责任与义务,尤其是对个人隐私数据的保护。数据的共享开放、流通交易和保护与安全,对数据技术提出研究挑战,数据的共享、开放、流通、交流、使用和保护对法律的制定与执行提出了很高要求,同时还需要平衡数据的保护与数据的开发利用。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20