
运用大数据提升国家治理现代化水平
一、您是怎么理解大数据的?大数据对国家治理、经济社会发展带来哪些影响?
信息技术的出现为数据处理提供了自动化的方法和手段,推动数据(信息)成为继物质、能源之后的第三大战略资源。大数据作为信息技术及其普适应用发展到一定阶段的“自然现象”,源于互联网及其延伸所带来的无处不在的信息技术应用以及信息技术的不断低成本化。当前对大数据基本共识是:大数据泛指无法在可容忍的时间内用传统信息技术和软硬件工具对其进行获取、管理和处理的巨量数据集合,具有海量性、多样性、时效性及可变性等特征,需要可伸缩的计算体系结构以支持其存储、处理和分析。大数据最根本的价值在于为人类提供了认识复杂系统的新思维和新手段,著名计算机科学家、图灵奖获得者Jim Gray将数据密集型科研称为继实验观测、理论推导和计算模拟之后,人类探索未知、求解问题的“第四范式”,即数据驱动。基于数据,我们可以去触摸、理解和逼近现实复杂系统。
大数据的重大价值和意义体现在:大数据是提升国家治理能力的新途径,政府可以透过大数据揭示政治、经济、社会事务中传统技术难以展现的关联关系,并对事物的发展趋势做出准确预判,从而在复杂情况下做出合理、优化的决策;大数据是促进经济转型增长的新引擎,大数据与实体经济深度融合,将大幅度推动传统产业提质增效,促进经济转型、催生新业态,同时,对大数据的采集、管理、交易、分析等业务也正在成长为巨大的新兴市场;大数据是提升社会公共服务能力的新手段,通过打通各政府、公共服务部门的数据,促进数据流转共享,将有效促进行政审批事务的简化,提高公共服务的效率,更好地服务民生,提升人民群众的获得感和幸福感。
二、不久前,中共中央政治局就实施国家大数据战略进行第二次集体学习。您怎么看待国家大数据战略?
当前,世界各主要发达国家都已意识到了大数据的重要意义,美国、欧盟、英国、日本、韩国、澳大利亚等国均出台了政策,大力推动大数据应用及产业发展。在我国,发展大数据也受到高度重视。2015年8月,国务院印发了《促进大数据发展行动纲要》。党的十八届五中全会将大数据上升为国家战略。在党的十九大报告中,习近平总书记明确指出:“推动互联网、大数据、人工智能和实体经济深度融合”。2017年12月8日,在中共中央政治局第二次集体学习时,习近平总书记发表了“审时度势精心谋划超前布局力争主动,实施国家大数据战略,加快建设数字中国”的讲话,明确提出了“大数据是信息化发展的新阶段”这一重要论断,并指明了推动大数据技术产业创新发展、构建以数据为关键要素的数字经济、运用大数据提升国家治理现代化水平、运用大数据促进保障和改善民生、切实保障国家数据安全等五项工作部署,为我国发展大数据开启了新的篇章。
大数据是基础性战略资源,数据资源的共享开放和对大数据的开发应用,将赋予我们在各个领域“全面了解、精准预测和智慧决策”的能力。国家大数据战略的实施,对我国实施系列强国战略及创新驱动发展战略、乡村振兴战略、区域协调发展战略、可持续发展战略、军民融合战略等都具有基础性支撑作用。
我国是数据资源大国,同时,通过前期的科研投入,在大数据相关技术领域系统性部署了研发任务,成果斐然,已具备加快技术创新的良好基础。“十三五”期间,在国家重点科技研发计划中实施了“云计算和大数据”重点专项,部分领域已取得较大进展。国家发改委组织建设11个国家大数据工程实验室,加强大数据领域相关技术创新的基地建设。各地也积极推出了一批大数据相关的政策和措施。发改委、工信部、中央网信办联合批复贵州、上海、京津冀、珠三角等8个综合试验区,正在加快建设。
然而,较之国际先进水平,我国大数据发展仍存在较大差距。具体表现在三个方面:一是基础理论与核心技术落后,这是导致我国信息技术发展长期处于“空心化”和“低端化”的根本原因,大数据时代如何避免此问题在新一轮发展中再次出现,是一个重大挑战。二是数据治理体系远未形成,原始数据资源丰富,然而数据壁垒广泛存在、法律法规发展滞后,制约了数据资源中所蕴含价值的挖掘与转化。三是应用发展不均衡,互联网应用市场化程度高、发展较好,但行业应用广度和深度明显不足,特别是和实体经济融合不够,生态系统亟待形成和发展。当前,国家大数据战略的实施可谓是恰逢其时,为我国建设自主可控的大数据技术体系和产业生态,构建完整的数据治理体系,以及全面推进大数据应用注入了强大动力。我相信,随着国家大数据战略的稳步推进,我国从数据资源大国发展为数据强国的目标一定可以实现!
三、在您看来,大数据在反腐败领域能有哪些应用前景?
大数据在反腐领域具有广阔的应用前景,可以从两个方面来认识。一方面,各个领域大范围的数据共享开放,将极大提升我国公权力机构的透明度,“让权力在阳光下运行”,可以有效地预防腐败现象的产生。另一方面,不同来源的数据经过有效的关联、融合,可以形成针对某个领域、某个对象的完整视图,使已经发生的腐败行为难以遁形。
大数据在侦破反腐案件方面,至少可以有以下两种应用场景。一是基于关联分析的隐含关系发现。通过融合公安、税务、金融、物流、出行、通信、消费等多源数据,可以建立人、钱、物、事之间完整、复杂的关系网络,从而帮助反腐案件侦办人员发现隐含关联关系、理清事件来龙去脉,辅助案件侦办。二是基于异常检测的疑似腐败行为预警。反腐领域涉及面广、相关信息非常庞杂,虽然腐败行为的蛛丝马迹被各种信息系统所记录,但这些信息“藏身于”海量的其他数据之间,往往很难发现。然而,腐败行为一般都具有一个共性的特征:异常性。例如:人员财产的异常变动、办事流程的异常变更、人际交往的异常行为等等。可以基于多源数据的分析和挖掘,有效地监测这些异常,从而为反腐侦办提供预警和线索。
随着大数据技术的发展和应用水平的提升,相信大数据将成为我国反腐斗争的一把利剑,在反腐领域大有所为!
四、大数据对领导干部的素质提出了哪些新要求?
习近平总书记在中共中央政治局第二次集体学习的讲话中指出:“善于获取数据、分析数据、运用数据,是领导干部做好工作的基本功。”这对领导干部的素质提出了新要求。
我个人理解,要“懂得大数据,用好大数据”,应具备三方面的能力。一是要理解大数据的内涵。认识到大数据不仅是体量巨大的数据集,更多地强调的是多源数据的聚集关联后所形成的某个领域的数据全集,对多源数据的充分融合和深度挖掘是大数据价值实现的重要途径。二是要建立大数据思维方法。思维是一种构造心理联想和对世界建立模型的脑力过程,是对信息的处理,用于建立概念、解决问题、推理和决策。大数据时代,信息技术和数据深入渗透到经济社会的方方面面,“数字化生存”的时代已经到来,为了更好地“建立概念、解决问题、推理和决策”,需要具备与“数字化”和“数据为中心”相匹配的新思维方式。三是要学习和掌握运用大数据的相关技能。掌握获取数据、分析数据、应用分析结果解决问题的基本方法。
在充分利用大数据推进各项工作的同时,我们也应认识到,大数据理论和技术都还处于发展早期阶段,远未成熟。当前对大数据相关的一些核心命题仍然存在争议,例如:数据“大”与“小”的对立统一,“关联”与“因果”的辩证性,“全数据”的相对性等等。近年来,虽然出现了一批数据应用的成功案例,但是针对大数据本质特征和规律,以及利用大数据求解问题的科学方法论体系等相关基础理论的研究却相对滞后,数据分析的结论往往缺乏坚实的理论支撑,缺乏“可解释性”,因此,我们在利用大数据分析的结论辅助决策时,仍需保持谨慎态度,“批判性思维”先行。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30