京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据如何优化公共服务
公共服务领域采用大数据技术和大数据思维,既可以为政府进行公共服务决策和加强公共服务监管服务,可以为公共服务消费者在内的社会公众提供个性化和精准化服务,也有助于公共服务提供者降低成本,从而更好地实现公共服务自身的经济和社会特性并存的要求。但是,大数据不仅是一种海量的数据状态及相应的数据处理技术,更是一种思维方式,是一场由技术变革推动的社会变革。在公共服务领域真正实现与大数据的融合,现实中还存在着多重挑战。
公共服务提供主体运用大数据的意识差异大。从公共服务提供者的角度来看,虽然公共服务提供机构对于数据的重视程度较高,但是范围更多地局限于对内部的数据认知。从总体来看,公共服务提供机构的管理人员并没有意识到外部数据如互联网数据与内部数据的结合所产生的价值,而是更多地把数据进行了存储,没有进行分析。这也加重了现有的数据孤岛问题和数据闲置现象。以人口管理为例,掌握准确的基础人口数据是人口管理的一大难点。涉及人口管理的有八九家部门,税务部门有纳税人口数据,教育部门有在读人口数据,公安局有户籍人口数据,社保局有参保人口数据,等等。孤立的任何一个数据库都不能全面展现一个地方的实有人口情况。
公共服务数据格式和采集标准不统一,导致数据可用性差。大数据预处理阶段需要抽取数据并把数据转化为方便处理的数据类型,对数据进行清洗和去噪,以提取有效的数据等操作。很多公共服务部门,每天都在产生大量的数据,但在数据的预处理阶段不重视,不同部门的数据格式、采集标准也非常不同,很多数据是非结构化的,导致数据的可用性差,数据质量差,数据处理很不规范。如危险化学品的监管问题,在目前的监管格局下,危险化学品在生产、储存、使用、经营、运输的不同环节,除企业承担主体责任外,由安监、交通、公安等部门分别承担监管职责,这些主体对信息报备的宽严尺度不一。这样的宽严不一,以及各监管部门、企业主体间存在的种种信息壁垒,大大影响了监管效能。
公共服务部门从业人员多元化,大数据专业人才缺乏。数据采集工作牵涉的绝不仅仅是数据问题,它与政府以及事业单位等的改革深刻关联,势必对基层人员的工作能力和责任感都提出更高的要求。数据的采集和分析是一个多专家合作的过程,这要求相关人员是复合型人才,既熟悉本单位业务和需求,具备相关专业知识和经验,同时又要了解大数据技术,能够综合运用数学、数据分析、机器学习和自然语言处理等多方面知识。面对大数据,如果不会分析,数据就只是数据;如果错误分析,数据反而还会造成新的问题。
教育、医疗、社会保障、环境保护等公共服务领域,由于技术难度相对小,而且推广意义大,可以起到“四两拨千斤”的作用,应当率先突破大数据的应用障碍,政府部门应当而且也可以在这一方面发挥更大的作用。
科学规划和合理配置网络资源,加强信息化的基础设施建设。没有信息化的基础设施建设,就谈不上信息化,更谈不上大数据。2013年8月,澳大利亚政府信息管理办公室(AGIMO)发布了公共服务大数据战略。到2013年底,澳大利亚人可以享受到每秒1G的互联网下载速度,而且安装宽带所需要的费用全部由政府免单,完全免费。对我国来讲,这一项工作只有以政府部门为主,根据发展需求,科学规划和合理配置网络地址、网络带宽等网络资源,并且鼓励大数据企业参与网络设施投资和电信服务运营。
与此同时,还应做好数据标准统一工作,为数据的采集、整合等提供支持。统一的标准是用好大数据的关键所在。应当加快研究建立健全大数据技术标准、分类标准和数据标准。针对行政记录、商业记录、互联网信息的数据特点,研究分析不同数据口径之间的衔接和数据源之间的整合,规范数据输出格式,统一应用指标涵义、口径等基本属性,为大数据的公开、共享和充分利用奠定基础。
政府搭建平台,推动公共服务部门与第三方数据平台合作,建设好社会基础数据库,助力提高公共服务效率和开展公共服务创新。公共服务部门可以考虑借助如百度、阿里、腾讯等第三方数据平台解决数据采集难题,为包括政府各职能部门在内的各种社会主体提高公共服务效率和开展公共服务创新提供可能。另外,在政府信息公开不断加强的基础上,加大数据的开放和共享,建立起公共服务领域的数据联盟。大数据越关联就越有价值,越开放就越有价值。须尽快确立数据开放基本原则,政府带头开放公共领域的行政记录等公共数据,鼓励事业单位等非政府机构提供在公共服务过程中产生的数据,推动企业等开放其在生产经营、网络交易等过程中形成的数据。最终建立起公共服务领域的数据联盟。
按照“抓两头,带中间”的思路做好大数据人才的培训和储备工作。大数据的核心说到底是“人”。相应的人才培训和储备工作要抓好两头。一头是基层。由于公共服务领域中相当多的数据是从基层采集的,因此需要加强基层基础建设,要求公共服务部门要有完整的原始记录和台账,确保原始数据采集的准确性。而且也要求基层工作人员理解统一的数据平台、统一的软件操作、统一的指标含义。随着采集数据标准的逐步统一,采集数据的各个部门还需要相应地修改原来的流程、采集方式、人力配置等等。政府有关部门应当制定适当的激励和约束机制,保障基层工作人员的素质和能力跟得上新形势的要求。另一头是高端。数据分析对国内高校人才培养也提出了新的要求。大数据人才的培养更多地集中在研究生阶段,从政府有关管理部门的角度来看,应该按照国务院简政放权、放管结合、优化服务的要求,放宽对高校专业设置的审批,真正落实高校管理自主权。鼓励并积极创造条件推动高校以及企业在大数据人才的培养方面进行探索。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29