京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据影响国家治理的三大问题
针对大数据时代国家治理的发展,中国人民大学信息资源管理学院教授安小米在《学术前沿》上发文,从“政府数据开放利用”“政务数据连续性管理”“大数据背景下国家机关个人信息保护”探索了大数据时代信息治理存在的三个方面问题,对其应对原则和实现途径进行了探讨。
政府大数据开放利用是社会治理公共服务能力提升的关键要素
我国政府部门掌握着大量的社会信息资源,这种局面是在长期计划经济体制下形成的,也与政府采集和政府管理审批机制有密切关系。
尽管自改革开放以来,市场机制在信息服务领域发挥了平衡价格与竞争的重要作用,但是在信息资源供给方面,尤其是在交通、工商、能源、环境等关键领域,政府部门仍然拥有对数据资源绝对的垄断。
与此相对,政府部门在充分开发利用这些数据资源方面的能力不足。首先是人力资源与人才队伍的紧缺。其次,政府部门缺乏开发这些数据资源的动力和激励。
政府数据开放利用是提高政府公信力的重要途径,是透明政府和公民社会建设的重要组成部分,是政府“用数据说话”,提高基于证据的国家治理能力的重要途径,有利于市民了解并施行他们的权利,增强其参与城市共治的积极性与话语权,促进社会稳定和谐发展。
政府数据开放利用是促进经济增长的强大推动力,有利于促进协同创新、竞争能力与生产能力提升及经济复苏,数据开放利用不仅可以提高政府资金支出的效率,还可以为大众提供更多更好的增值创新服务选择。
政府数据开放利用计划活动应该遵循以下原则:
第一,以合法合规合标开放利用为原则,以不提供开放利用为例外;
第二,安全原则,根据安全等级确定数据开放利用范围、风险等级及使用权限,注意国家机密、商业机密和个人隐私的保护;
第三,增值导向原则,开放的目的是促进数据资源社会化增值开放利用,注意数据资源的公益性和商业性利用及其经济与社会价值实现,促进政府整体效率、效益和效能提升,行政效用、经济效用和社会效用提高;
第四,连续性管理原则,政府数据资源是城市公共信息资产,国家机关应按照统一规划和持续改进的全程管理原则,开展其政府数据全生命期的管理,合法采集、合规登记、合标更新、安全存储和及时处置,保证管理活动的连贯性、一致性和规范性;
第五,可持续利用原则,数据具有真实性、可靠性、完整性和可用性,内容可取、可信并及时更新,资源可跟踪、可回溯和可关联,格式机读,方便下载并可持续再用;
第六,责权利统一原则,政府数据属公共资产,政府对数字采集质量和开放使用授权及数据资源服务平台负责,数据开发商和数据使用者对下载后数据的使用行为负责。
政务数据连续性管理是社会治理协同创新能力提升的关键要素
政府大数据也需要相互关联。大数据之大,除了传统的三个“V”( Volume,Variety和Velocity)之外,更重要的在于独立的数据一旦相互关联起来了之后,能从多个维度挖掘出更多的价值,其包含的信息内涵也是几何级数式的增长。
从整体上来看,我国政府大数据仍然是处于割裂的状态。而政府大数据的割裂其实是我国政府部门的条块管理体制的一个缩影。“信息孤岛”问题严重,各政府部门都为解决该问题开始了部门内部的各子系统、业务系统的整合工作,以及上下级部门的系统对接工作。
数字连续性的涵义包含为以下四个方面:
一是指数字生成记录,能够以数字方式保存和提供可持续再用的能力;
二是指数字生成信息,能够以数字方式维护,确保其可获取、可信任和可持续再用的能力;
三是指数字生成内容,应该能够以数字方式管理,确保其可跟踪、可溯源、可关联和可控制的能力;
四是指数字连续性的业务过程、管理过程中,有相应的政策制度连续供给作为保障,同时,有技术、人员、资金、信息环境、业务需求等作为数字连续性的有效支撑。
政务数据连续性管理的基本原则及实现途径包括以下三个方面:宏观层,提出主体联盟原则,制定政务数据连续性行动计划,实施数据资源资产管理,建立数据资产登记管理制度、验证制度和认证制度,目标互联、互通、互认,确保数字凭证和电子证照的合法性采集和合理性利用,以此提升我国国家数字信息资源的安全力、证据力、服务力和控制力;
中观层,提出活动联通原则,制定政府数据处理活动规范化管理标准,实施数据资源风险管理,建立跨地区、跨部门和跨层级的数据采集、共享交换、存储、处置、发布统一标准和数据开放利用授权许可框架及契约管理制度,避免因数据管理不善带来的信息丢失、记忆忘却、身份无法认同、个人隐私和国家机密泄露威胁等高风险,将政府信息资源治理纳入国家治理现代化能力提升的范畴;
微观层,提出要素联接原则,制定覆盖数字文件全生命期、数字信息全流程、数字资源全要素的数据资源全面质量管理协同创新平台,实施电子文件自动化管理和数据开放利用在线授权许可,将数据文件自动化管理、数字信息网络化管理和数字资源智能化管理技术联接,并嵌入政府和大数据工程信息基础架构,以此提升大数据时代的政府公共服务能力和社会管理创新能力。
个人信息保护是提升社会治理信息安全能力的关键因素
十年前,当互联网正处于萌芽阶段,网络身份是虚拟的、模糊的。我们无法确定网友的性别和年龄。十年后,信息技术的革命带来了大数据时代,我们的联系方式、喜爱偏好甚至同事、家人、朋友都被掌握得一清二楚。我们都成了“透明人”。同时可以看到,我国现有涉及个人信息保护的29部法律尚无专门针对网络环境的特殊要求。
针对我国尚无专门的政府信息资源管理办法和个人信息保护法律的现状,提出以下在法律法规不健全的背景下,如何构建适用于大数据项目应用的个人信息保护对策的基本原则。
一是合法便民原则。政府部门采集个人信息应该建立信息采集登记制度,政府部门内和部门间共享个人信息应该依法依职,从方便信息主体和降低公共服务成本的角度,从信息惠民工程建设需求出发,做好个人信息采集登记和共享使用过程记录,以备后查,跟踪审计和持续改进。
二是安全性维护原则。个人信息保护需要维护个人信息的保密性、完整性、真实性、可靠性、可用性,管理体系、管理制度、管理规范、管理技术配套,防止未经授权的复制、修改、使用和公开数据,防止个人信息泄露、丢失、损毁、篡改或其他安全事故的发生。
三是全程管理原则。个人信息不仅是大数据项目的重要数据来源,也是重要的社会资源和个人资产,需要统筹管理,建立基于个人信息全生命期和信息处理全流程、信息管理活动全要素的综合集成管理体系,对信息处理的关键节点实施风险控制,对信息采集、使用与共享、更新和处置、安全与保管、信息系统管理、监督检查与咎责等活动进行规范,保证管理活动的连贯性、一致性和规范性,提高社会管理和公共服务效能。
四是信息化治理原则。大数据项目应用背景下,应当建立基于信息全流程管理的信息化治理制度和规范,确保数字个人信息采用数字方式保存和提供再用,应该构建信息化项目个人信息保护的服务与产品认证体系和品牌标识。
五是风险导航原则。大数据项目应用背景下,个人信息的共享再用不可避免,但需要合法、合规、合标、合理,按照“共同带有区别”的原则,制定分类保护的目录和分级授权利用的规范,将个人信息分为个人一般信息和个人敏感信息,编制个人信息分类保护目录和制定分级利用授权规则,便于控制风险,易于信息化管理,以维护信息主体的合法权益不受侵害。
六是协同管理原则。考虑大数据项目应用背景下的个人信息保护复杂性、不确定性和集成性特点,应该将其嵌入政府信息资源管理规划,多关系联通;纳入政务绩效评估与问责,纳入信息化项目绩效评估,多主体联盟;嵌入政务资源管理标准体系,多政策规范联贯;嵌入信息化项目合同契约协议,嵌入在线服务要求,多要素联接。
七是综合集成管理原则。大数据项目应用背景下个人信息保护不仅是政府信息资源管理的重要内容,也是政府信息资源社会化开发利用的保障,个人信息保护应该嵌入服务型政府建设体系,嵌入国家机关公务人员管理技能及能力构建,增强国家机关个人信息保护意识与管理责任,提升政府的社会管理及服务能力;
组织层面,应该以信息资源全生命管理思想为指导,以个人风险评估及安全控制为手段,建立合法、合规、合标和合理的管理制度,嵌入国家机关电子政务绩效考核体系;
大数据应用项目层面,应该建立可规划、可实施、可评估和可持续改进的信息化项目个人信息保护与管理方案,纳入政府信息化投资项目的绩效评估体系,系统采购外包,信息安全技术工具认证等行动计划,使个人信息保护可管理和可控制,确保其安全利用,服务于民。
综上所述,政府数据开放利用、政务数据连续性管理和国家机关个人信息保护问题是政府社会治理的关键要素,直接影响大数据时代政府社会治理的公共服务能力、协同创新能力、信息安全能力及国家治理现代化能力提升。
从整体规划的角度提出部署政府数据开放利用计划、实施政务数据连续性管理制度和制定适用于大数据项目应用的个人信息保护对策的基本原则与实现途径,为大数据治理和信息治理环境改善可以提供了新的路径。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21