京公网安备 11010802034615号
经营许可证编号:京B2-20210330
全民“大数据时代”:政府机遇与挑战_数据分析师考试
全民“大数据时代”,从政府层面而言,该如何以大数据提升科学决策水平、管理效率,以及服务的精细化人性化?又该如何维护数据安全,防止其在法外任性“裸奔”?
近两年,“大数据”成了最受关注的词语之一,不仅是因为其为一个新概念,更是因为大数据正在逐渐影响我们的生活,其背后隐藏着一个巨大的产业。
随着现代信息技术的迅猛发展,一个大规模产生、分享和应用数据的时代正在徐徐开启,基于互联网的大数据与云计算、物联网、智能终端等都是新一代信息技术的重要标志,已经深刻影响了经济、社会、教育、医疗和行政管理等多个领域,极大促进了产业发展转型、管理方式变革和社会效率提升。
5月26日,在“2015贵阳国际大数据产业博览会暨全球大数据时代贵阳峰会”上,中共中央政治局委员、国务院副总理马凯在发表讲话时说,大数据已经成为新时代最具价值的宝藏之一,某种程度上说,谁拥有了大数据谁就拥有了未来。
大数据逐渐影响我们的生活
“昨天我从香港飞过来,飞机晚点,于是改变计划决定临时找我33年前的一个大学同学,但我不知道他的电话和地址,就在微信群发一条信息,结果不到一分钟时间很多人把他电话和地址告诉我,根据朋友圈提供的地址在腾讯的地图上一看,原来他就在离我不远处。”香港城市大学教授马建向记者说,通过微信和社交网络把信息公开,大家参与,有了效果。这就是大数据的运用,事实上,大数据已经悄悄走进了人们的生活。
一个糖尿病病人,先后到深圳、北京、上海求医。在过去,每个医院都是一个封闭的体系,都有一套自己的数据,都不对外开放,甚至在同一个城市的医院,检查报告单也互不承认,给病人带来了很多麻烦。只能拎一堆的病历,奔波于各大医院,而现在,通过“就医160”,自身的看病记录一目了然,既省去了很多麻烦,也避免了资料丢失。全国最大的互联网医疗服务平台——“就医160”首席执行官罗宁政在接受记者采访时表示,医疗数据流动起来才有价值,“就医160”的大数据使命就是让医疗数据流动起来,让死数据变成活数据。
罗宁政说,医疗大数据不仅有助于治疗,预防方面的作用同样突出。还是以糖尿病患者为例,“就医160”最近与专注血糖智能管理和糖尿病医患互动移动医疗平台——血糖高管展开合作;一头连接糖尿病病人的血糖、血压、饮食、运动、用药、睡眠、糖化蛋白等生命体征数据;另一头则连接全国数万名糖尿病医生,在多达45种糖尿病并发症中,每个领域都能找到擅长的医生。
“当然,这些数据都掌握在患者自己手中,在我们的云平台,如果没得到患者许可,我们都不能查看。”罗宁政说。
“就医160”总部位于深圳,平台用户数已超两千万;成功预约挂号人次达3600万,位居全国第一;而可挂号医院也从2014年底的600家,增加到现在的1000家,增加近七成。医院和用户范围涵盖全国29个省区市。
各地反映交警执法不严或者滥执法的事情时有发生,而贵阳交警在致力于“工作零失误,人员零违纪”。贵阳市交管局宣教处处长龙宇向记者介绍说,如果是酒驾,只要对着执勤民警的酒驾检测仪吹气,不到半分钟,“贵州省酒驾管理信息系统”上便出现了此台酒精检测仪的详细信息:检测时间、检测地点、测试人、被测试人等信息一目了然。从查缉到抽血再到送检的整个过程,都被他们所佩戴的执法记录仪完整记录,并实时上传到后台系统留存。而在血样检测实验室,实行24小时摄像监控。
“联网运行的酒精检测仪会实时将检测信息上传至后台,且无法改动。”龙宇说,系统信息会被追踪,如不作为则会接受处罚。
目前,已有1万余套执法记录仪投入使用,实现贵阳市交管系统民警全覆盖、2千余套数据采集器累计采集6亿条动态数据、20余套信息化系统涵盖公安交通管理的方方面面……走进贵阳市公安交通管理局,俨然置身数据海洋。
“在数据面前,每个民警都是透明人。”龙宇说,在保证全体民警行为数据覆盖的同时,信息系统还通过用户权限分配、IP绑定、身份证识别、数字证书唯一认定等技术手段,努力使各项业务流程和活动轨迹关联到具体人,实现权力运行和个体行为“事事进流程,人人全留痕”。
贵州省省长陈敏尔在峰会上表示,以大数据引领产业升级,促进新一代信息技术与三次产业融合发展,实现百姓富、生态美的有机统一。以大数据助推政府转型,通过数据的集聚、融通、应用,用好政府“有形之手”和市场“无形之手”,实现“人在干、云在算、天在看”,提升政府治理能力。以大数据服务社会民生,通过大数据、云计算手段,在医疗健康、社会保障、交通旅游、食品安全等方面创造更加丰富的公共产品,让人民群众有更多“获得感”。
“贵阳率先打造全域公共免费WiFi城市。现在,各位打开手机就能连接到贵阳免费WiFi,可以轻松愉快地‘刷屏’、‘晒幸福’。” 陈敏尔笑称。
数据公开提升政府治理能力
贵阳不仅是中国首个全域公共免费WiFi城市,今年4月,在京举办的“2015贵阳国际大数据产业博览会暨全球大数据时代贵阳峰会新闻发布会”上,贵阳市副市长刘春成在发布会上介绍,在不到一年的时间里,贵阳创造出五个“中国第一”,即中国首个大数据战略重点实验室、中国首个全域公共免费WiFi城市、中国首个块上集聚的大数据公共平台、中国首个政府数据开放示范城市和中国首个大数据交易所。
最先进的大数据为什么生长在欠发达的贵阳?
“大数据是贵州、贵阳的战略,这个战略的背后是块数据思想的引领。”大数据战略重点实验室主任连玉明在发布会上如是表示。
何为块数据?
作为贵阳积极探索大数据的理论成果,《块数据——大数据时代真正到来的标志》一书也在发布会现场正式首发。在书中,对块数据这一概念,有这样的解释:块数据如同计算机主板,建立起了一个开放、共享、连接的数据基地,各个行业和部门的“条数据”如同一个个可插拔的板卡,它们只有融合并集成到主板上,才能发挥数据资产真正的功效;块数据实践应用所形成的全产业链、全服务链和全治理链,将更大程度地驱动产业升级、服务改善民生、推进城市转型和倒逼政府改革。而“数据铁笼”就是块数据在贵阳成功实践的最新例证。
今年2月1日,贵阳市依托大数据产业发展优势,选择行政权力相对集中、工作内容与群众生活息息相关、网络技术运用有一定基础的市交管局和住建局两家单位作为试点,全面启动“数据铁笼”计划。围绕可记录、可公开、可分析三大目标,数据铁笼建立起“用数据说话、用数据决策、用数据管理、用数据创新”的管理机制,用数据化的方式全面记录权力运行过程。信息化系统涵盖行政审批、执法办案等各类管理业务,权力运行过程被全天候、多维度监督,真正实现阳光运行。
2月,李克强总理考察北京·贵阳大数据应用中心时说,把执法权力关进“数据铁笼”,让失信市场行为无处遁形,权力运行处处留痕,为政府决策提供第一手科学依据,实现“人在干、云在算”。
在贵阳市交管局法制处处长樊劲松看来,“云在算”的好处在于,以执法效能档案为基础,利用大数据技术,量化原来抽象的、个体的执法行为,能够从执法、诚信和效能等多方面建立一套全面、公平、科学的评价体系,“实现对平台对象全方位、多维度、深层次的立体评价,推动人事绩效管理革新。”
利用大数据的分析研判,除了在个人评价体系能够做到更加科学、全面,还能在宏观上为政府决策提供更科学、更详实的依据。交管局针对特定路段交通违法行为的数据分析,实现对路段交通组织的科学性、合理性分析,从而得出符合现实需要的交通组织和管理方案。通过数据深度挖掘进一步完善了客运车辆运行分析模式,为合理测算运力、推动公交都市创建、解决交通拥堵等民生问题提供科学决策依据。
依托信息系统的数据分析,交管局公布了贵阳市2014年出现最多的6类交通违法和违法最多路段,提醒驾驶员守法驾车,支招避免违法的驾车方法。利用现有数据资源,分析开学前后道路交通情况,预警播报提醒广大驾驶人朋友早晚高峰的时间和易拥堵路段。
樊劲松介绍,下一步将整合交管系统相关20多个信息系统,统一存储在云平台上。通过云平台实现对各个业务子系统的统一管理和数据交换。
云平台的建立,使得运用大数据技术,实现对数据的共享交流、整体分析成为可能。同时,利用云平台,对各项权力进行认真梳理,交管局推出权力清单的数据化描述。“重点对权力风险点及运行流程进行细化,并通过信息化的手段将预警、跟踪、督办、反馈等监督功能嵌入权力在业务系统中的运行过程,实现数据化记录。”樊劲松介绍,目前交管局已全面梳理了涉及酒驾查处、号牌资源管理方面的风险点梳理及数据化流程描述方案。
数据铁笼的搭建,由于其可公开、可记录、可追溯的特点,为创新反腐工作途径提供了重要支撑。
权力运行公开化、规范化是防止权力腐败的最有效手段。在交警移动查岗服务平台,可实时查询到民警24小时于室内室外的工作情况。贵阳市交管局纪委书记徐萍介绍说:“一个民警一天的工作时间和工作区域都在这里呈现,如果他在工作时间超越了工作范围,系统会自动用蓝色标注并进行记录,考勤部门就可以直观地对民警情况进行考核。”
国家信息中心副主任李凯介绍说,国家发改委目前大规模地利用大数据分析,推出了对外的政府办公大厅,建立了大数据的分析中心。“所有的举措,在发改委过去是很难见到的,现在随着大数据时代的推进,国家发改委的整个工作也朝着信息化,朝着大数据应用改变。”李凯说,大数据时代既为促进我们国家的治理方式、理念的转变,提供机遇,也为我们社会治理创新提供了挑战。根据大数据时代的特点,变革社会治理的思考方式,这是大数据时代的需要。
“大数据改变了人们的生活,政府开放数据,增加政府的透明度,也可以增加政府的公信力。” 马建说。
大数据安全有待立法保障
在人们对大数据极力热捧之时,大数据的安全危机已经逐渐显露,大数据安全隐患的“冰山一角”已经呈现在我们面前。
此前,有媒体报道,目前社保系统已经成为个人信息泄露“重灾区”,目前重庆、上海、山西、沈阳、贵州、河南等省市卫生和社保系统出现大量高危漏洞,数千万用户的社保信息可能因此被泄露。
面临泄露危机的社保数据究竟涉及多少人,它的涵盖内容又是什么呢?媒体称,“目前围绕社保系统、户籍查询系统、疾控中心、医院等大量曝出高危漏洞的省市已经超过30个,仅社保类信息安全漏洞统计就达到5279.4万条,涉及人员数量达数千万,其中包括个人身份证、社保参保信息、财务、薪酬、房屋等敏感信息。”
的确,这就是我们几乎每天都能听到的大数据,也是目前被业界致力发展的大数据。大数据时代能给我们带来机遇,也能带来挑战。
“1775年,美国邮政系统建立,在过程中邮件被打开,这是常有的事情,电话出现以后,开始被窃听。现在进入了互联网,我们的邮件、我们在网上的聊天、痕迹信息所有都在外面,这些东西属于谁,我们每天都被别人消费。” 中国信息协会大数据专委会副主任委员文金言说,关于这些信息,我们必须谨慎处理。“政府不侵犯你的隐私,也不收集你的数据,但政府可以从电信公司等第三方拿到你的数据,除此之外,另有一些机构和个人都可以通过第三方取得相关数据,这样法律责任是谁的?”
文金言认为,保护公民隐私,这是政府职责,政府是最大的信息收集者,公民相信政府,政府有义务保护隐私,如果大家都不相信外面是安全的,那为什么要把信息放在外面,主管部门现在必须关注隐私的问题。对于此,他讲了一个例子:2014年5月,欧盟最高法院裁决了一起互联网上公民的被遗忘权。一个西班牙公民诉讼称,他在1990年,经商和贷款信息被网络公布,去贷款时一经网络搜索,政府部门拒绝了他的贷款请求。他找谷歌要求删掉未被接受,一路官司打到了欧盟,最后裁决下来,公民的隐私权叫被遗忘权,西班牙公民胜诉。现在谷歌不得不成立一个专门保护隐私的部门。
中国社会科学院法学研究所周汉华研究员表示,大数据在传统个人信息保护框架下,会面临很多新的问题。因为大数据是通过数据的整合来利用和开发数据。原来不是个人信息的东西通过大数据很可能变成可以识别的个人信息,比如美国国家安全局(NSA)所指的原数据,原数据并不是原通话内容,只是通话时间、呼入呼出的电话号码。NSA说它没有听过任何人的通话,而它通过原数据却可以把很多人抓起来,因为原数据分散来看似乎和个人没有关系,但把这些数据集合在一起就会发生化学反应。
对于如何保证数据安全,中国工程院院士、中国智能终端操作系统产业联盟技术委员会主任倪光南说,在信息化建设中,往往要对所采购的货物、工程服务等是否满足网络安全需求进行评估。有一种观点认为,只有做到了自主可控才有可能达到安全可靠。当今技术复杂度越来越高,一个软件可能包含千万行原代码,一个芯片可能包含几亿个晶体管,对于这种复杂度的软硬件,如果不是自主可控,要想通过第三方的测试分析来找出“后门”,基本上是不可行的。
“安全是大数据的生命线,必须全面推进大数据安全国家战略,构筑维护个人隐私、公共空间、国家安全、政府资源、场所交易等五大安全的‘大数据长城’。保护数据安全,呼唤立法先行。必须加快大数据安全立法进程。”连玉明教授说,尤其是尽快将大数据中涉及个人隐私的法律保护提上立法议程,同步推进数据标准、数据开放、数据脱敏、清洗和交易的政策和法律制定,依法规范大数据商业行为,绝不能任由大数据运用在法外任性“裸奔”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据可视化领域,树状图(Tree Diagram)是呈现层级结构数据的核心工具——无论是电商商品分类、企业组织架构,还是数据挖掘中 ...
2025-11-17核心结论:“分析前一天浏览与第二天下单的概率提升”属于数据挖掘中的关联规则挖掘(含序列模式挖掘) 技术——它聚焦“时间序 ...
2025-11-17在数据驱动成为企业核心竞争力的今天,很多企业陷入“数据多但用不好”的困境:营销部门要做用户转化分析却拿不到精准数据,运营 ...
2025-11-17在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07