
建议立法护航 打破“孤岛”释放大数据价值
在互联网时代,如何让数据释放更多的价值,成为各界关注的焦点。在今年的全国两会上,如何构建大数据经济体系、大数据如何服务社会等成为委员代表们的热议话题。昨日,记者采访了多位政协委员,就相关话题展开讨论。
现状
数据来源多样缺乏共享,数据成孤岛
全国政协委员张近东告诉记者,随着“互联网+”的深入推进,数据和人力、物力、货币、能源一样,成为企业和社会经济发展的要素资源,以开发和利用数据资源为目的的政治、经济和社会活动迅速扩大着数字产业的规模。
但是目前,由于数据来源的多样,政府和企业间各自拥有的数据资源缺乏整合与连通,信息孤岛、数据壁垒现象仍然存在。导致数据的社会价值、经济价值无法得到充分的挖掘利用,企业在数据信息获取和使用上成本高昂。例如,仅小额信贷发放过程中的身份验证环节,很多企业每年就要花费百万级甚至千万级的费用。
在另一个方面,因知识产权保护意识落后,信息安全技术实力不强,法规监管盲区等问题,个人隐私泄漏事件频发。且在法规方面,对借工作之便盗用贩售他人信息的职务犯罪,严重程度界定不够清晰,处罚力度不够,未起到有效的抑制作用。
全国政协委员谢晓尧也认为,由于一些地方没有意识到只有共享的数据资源才能释放数据的价值,因此,不重视数据开放,一些数据富集部门将数据视作部门财富,不愿意开放,或者希望获取更大的商业利益或主导权。
他表示,这从客观上形成了行业垂直的信息化体系,在地方上形成了条块分割的信息孤岛,数据开放需要纵向层层审批,造成了信息在一个区域平台共享的难度。同时,数据开放是一个新兴事物,缺乏自上而下的法律法规、执行标准、开放标准,让地方推进上无所适从。
应用
利用大数据人脸识别技术可“打拐”
那么大数据如何对人们的实际生活产生影响呢?全国政协委员李彦宏向记者表示,今年自己的提案之一,就是建议利用人工智能和大数据技术,帮助解决走失儿童问题、解决城市交通拥堵问题。
李彦宏说,近年来,人工智能和大数据技术不断完善,应用日趋成熟,有望进一步促进儿童走失案件的侦破。一方面,人脸识别能够提升图像侦查效率,尽早锁定失踪儿童或涉案人员。另一方面,人脸识别能够实现海量人脸数据的跨年龄比对,帮助侦破儿童走失积案。
李彦宏表示,可能孩子是在很小的时候走失,他再进入公众视线可能已经上小学了——比如办学生证的时候需要拍照片,这种情况下通过人工智能的比对,就有可能比以前更加高效的帮助有关部门和家庭找到走失儿童。目前大数据在这方面已经比较成熟了,可以应用到公安机关等相关的部门。
同样,大数据可以改变人们的出行。李彦宏说,交通拥堵已成为我国很多大中城市普遍存在的问题,而我国交通信号灯系统在数据采集、算法优化等方面存在不足,无法充分发挥其在缓解交通压力方面的作用。利用人工智能图像识别、图像分割等技术,则可以实现提升交通流数据采集能力,加强智能交通信号灯配时方案算法研究,做到信号灯优化配置,提升交通流畅度。
建议
顶层设计建国家层面大数据平台
如何将大数据的这些效益发挥?多位政协委员均表示,需要自上而下形成数据体系。在李彦宏看来,就以利用大数据“打拐”来说,需要建立适用于搜寻走失儿童的人脸识别模型;建立覆盖全国的走失儿童数据库;将人脸识别技术与治安、交通监控系统相结合等。这就需要国务院办公厅牵头,协调公安部、民政部等重要组成单位,统筹企业和社会力量。
全国政协委员谢晓尧认为,要充分实现大数据的价值,需要针对数据开放采取立法、建立标准、展开执行监督等一系列的措施,一方面规范数据开放,另一方面形成数据开放的倒逼机制,推动各级政府及相关社会组织实施数据开放。
他建议,可以通过建立“城市数据资源管理中心”,运用PPP模式,以企业为建设和运营主体,将政府、社会的数据汇聚和管理,建立城市开放数据的统一管理平台,为数据应用创造条件。
张近东也认为,需要建立政府主导、市场化运作的数据全生命周期管理顶层设计,打破传统的信息部门管理机制,建立国家层面的大数据平台,为政府机构、企事业单位、公民提供数据服务,政府作为数据开放共享的主体,引导企业接入大数据平台。
他建议,国家可以从制度层面,规范数据的采集、加工、流通和应用等全链条,保证数据的完整性、真实性、准确性;企业层面可以通过合作协议、激励机制等方式,引导企业开放自身数据,实现信息共享的市场化。
张近东建议,当前最先需要解决的,是引导数据共享服务与公众需求,可以在公众迫切需要的领域进行尝试,如银行征信信息、交通信息、环境信息等数据,率先推进开放共享;探索建立信息资源社会化增值开放共享绩效评价制度,鼓励创业企业运用和开发数据产品,形成应用数据大众创业的局面。
积极推进立法为数据共享安全护航
在大数据时代,数据的安全是绕不开的话题。谢晓尧建议,应从顶层设计开始,建立数据开放立法推进委员会,尽快启动数据开放立法,让数据经济建设有法可依。
张近东也表示,应该由国家相关部委牵头,联合互联网技术供应商和互联网服务企业,制定信息保护技术标准,同时通过强制培训等方式,在企业中普及信息保护的技术知识;由国家标准相关部门制定完备的参考方案,并提供相应的管理流程,并通过工商等企业管理部门提出合规性要求,强制各类公司考虑控制IT风险在内的各种风险。
在具体企业监管时,可以对企业进行分级,根据不同企业等级,制定相应法规、管理条例,强制要求相应等级企业参照国家相应标准,采取符合其等级的技术和管理规范,并保证其在信息保护方面的经费投入与其信息数量、敏感度匹配;针对相应投入较大企业,可考虑以补贴、退税等方式缓解企业压力。
同时,他表示,因目前信息泄漏源头环节相对廉价,每条仅为1元不到至10元不等,仅从涉案金额来看往往不高,且最高处罚仅为三年以下有期徒刑,无法形成有效制约。因此,建议以信息泄漏及信息转卖数量作为界定标准,提升处罚刑期上限,遏制整个信息泄露链条的关键环节。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30