
大数据创新信息化测评方法
目前信息化评测方法基本上是从传统的统计方法延续过来的,其数据主要来自两个方面:各地区政府管理部门上报数据和有关部门的抽样调查。但是,这两种数据来源对于评价地区信息化水平来说,都存在一定的问题。
政府部门提供的数据容易偏重于建设方面,如信息化建设投资了多少、铺设了多少皮长公里光纤、建设了多少数据库、存储了多少数据资源等等,这些数据只能反映政府在信息化建设上做了多少工作,而不能反映信息化的应用效果;利用抽样调查取得的数据也有问题,原因在于样本很难随机抽样、问卷设计难以规范、用户回答的随意性太大,满意度很难作为客观的评价指标。
同时,在评测信息化水平的指标选择上也存在一些问题:指标陈旧、更新不及时、跟不上信息技术环境的变化等。例如移动互联网、电子商务、云计算、物联网等应用很难纳入统计。
总之,传统的统计方式适合于纵向历史数据比较,很难适应以横向比较为主的快速变化的信息化形势。为了能够相对客观地比较各地区信息化发展水平,应当尽量使用一些计算机产生的数据,减少人为随意性带来的不确定性。因此,对于信息化的评测,需要另辟蹊径。
利用大数据方法获取数据
应当看到,地区的信息化水平并不等于信息化建设投资的规模,也不等于信息系统能够提供的功能。城市的信息化水平主要是指信息化应用的普及率、应用深度及应用效益水平。信息化应用水平,尤其是应用效益是不可控的,政府可以建设许多项目,但公众是否愿意使用则是另一回事。应用普及是公众的自主选择的结果,一项对公众帮助不大的服务,用户肯定门可罗雀,用户规模更能反映信息化建设的效果。城市信息化水平的调查重点应当是应用规模。注重最终用户效益的统计调查,有利于管理者重视整体效益,重视各方面环境的配套,也有益于智慧的城市建设。
为提高数据获取的效率、增加数据的客观性,我们应当充分利用大数据的方法对传统方法进行改进。信息技术普及到今天,很多应用数据都能够通过自动化的渠道来获取,需要选择的指标不需要太多,多则惑,少则得。GDP之所以受到人们的关注,最重要的原因就是简单。因此,信息化的评测数据也要力求简单,便于普及与推广,只要能够说明问题,指标数目少一些更好。
大数据可以有以下几个来源:搜索网站(如百度)、信用卡公司(如银联)、电子商务公司(如阿里巴巴)、运营商(三大运营商均可)以及可提供政府网站点击率、市民卡使用率的机构。这些企业与机构提供的数据都是由计算机自动生成的,没有人为干预,数据规范而客观,对于评价地区信息化发展水平是很好的参考资料。
五大参数反映信息化水平
从数据获取的难易性和客观真实性出发考虑,笔者建议利用五大“利用率”指标来评测一个地方的信息化发展水平,这5个利用率分别是信息资源利用率、智能设施利用率、通信设施利用率、政府网站利用率和电子商务利用率。
信息资源利用率:主要数据来源是百度的搜索引擎,可以方便地统计出全国每一地区的搜索量,得出各地区网民的平均信息资源的利用能力,内容可进一步分为信息类、娱乐类、电子商务类。
智能设施利用率:包括银行卡刷卡量、市民卡刷卡量、交通卡刷卡量。这三类数据都较容易获取,人均智能卡使用率能够比较准确地反映城市智能设施的应用效果。
通信设施利用率:主要是地区通信数量,包括3G通信的比例,人均通信量越高的城市,信息化水平越高。通信量还包括城市进出人口的通信统计,可以反映城市人口的流动率,人口流动率也是反映城市信息化水平的重要数据。
政府网站利用率:政府网站点击率能够反映政府电子政务被使用的效果,电子政务网站向城市居民渗透率是评价电子政务效果的重要指标,这个数据并不难得到,分析这些数据对电子政务改进很有价值。
电子商务利用率:电子商务利用率也是评价一个地区信息化水平的重要指标,该数据可以向阿里巴巴订购,可以比较一个城市的电子商务普及率、物流覆盖率、居民消费能力,电子商务统计数据对于比较各地信息化水平十分重要。
上述数据除以地区人口数,即得到相应的信息化参数值。这些数据都是来自计算机的自动统计,在通过数据分析师的进一步整理,因而有着更好的客观性。如果有机构能够将这些数据组织为完整的系统向全国发布,对于各地政府的智慧城市建设会有很大帮助;而承担这项工作的机构有无行政权力并不重要,重要的是创意与合作能力,政府、民间都可以做,或许民间机构会做得更好。
将各地区信息化数据加工成为一个指数来进行信息化统一排名的必要性不是很大,因为各地区环境差异太大。但是,分类的排序却很有好处,有助于各地区看到具体的差距,以便于改进。将这五个参数用雷达图表达会更加直观,从雷达图上可以看出本地区信息化发展的薄弱环节,有助于地方政府改进工作。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
PowerBI 累计曲线制作指南:从 DAX 度量到可视化落地 在业务数据分析中,“累计趋势” 是衡量业务进展的核心视角 —— 无论是 “ ...
2025-08-15Python 函数 return 多个数据:用法、实例与实战技巧 在 Python 编程中,函数是代码复用与逻辑封装的核心载体。多数场景下,我们 ...
2025-08-15CDA 数据分析师:引领商业数据分析体系构建,筑牢企业数据驱动根基 在数字化转型深化的今天,企业对数据的依赖已从 “零散分析” ...
2025-08-15随机森林中特征重要性(Feature Importance)排名解析 在机器学习领域,随机森林因其出色的预测性能和对高维数据的适应性,被广 ...
2025-08-14t 统计量为负数时的分布计算方法与解析 在统计学假设检验中,t 统计量是常用的重要指标,其分布特征直接影响着检验结果的判断。 ...
2025-08-14CDA 数据分析师与业务数据分析步骤 在当今数据驱动的商业世界中,数据分析已成为企业决策和发展的核心驱动力。CDA 数据分析师作 ...
2025-08-14前台流量与后台流量:数据链路中的双重镜像 在商业数据分析体系中,流量数据是洞察用户行为与系统效能的核心依据。前台流量与 ...
2025-08-13商业数据分析体系构建与 CDA 数据分析师的协同赋能 在企业数字化转型的浪潮中,商业数据分析已从 “可选工具” 升级为 “核 ...
2025-08-13解析 CDA 数据分析师:数据时代的价值挖掘者 在数字经济高速发展的今天,数据已成为企业核心资产,而将数据转化为商业价值的 ...
2025-08-13解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-08-12MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-12PyTorch 中 Shuffle 机制:数据打乱的艺术与实践 在深度学习模型训练过程中,数据的呈现顺序往往对模型性能有着微妙却关键的影响 ...
2025-08-12Pandas 多列条件筛选:从基础语法到实战应用 在数据分析工作中,基于多列条件筛选数据是高频需求。无论是提取满足特定业务规则的 ...
2025-08-12人工智能重塑 CDA 数据分析领域:从工具革新到能力重构 在数字经济浪潮与人工智能技术共振的 2025 年,数据分析行业正经历着前所 ...
2025-08-12游戏流水衰退率:计算方法与实践意义 在游戏行业中,流水(即游戏收入)是衡量一款游戏商业表现的核心指标之一。而游戏流水衰退 ...
2025-08-12CDA 一级:数据分析入门的基石 在当今数据驱动的时代,数据分析能力已成为职场中的一项重要技能。CDA(Certified Data Anal ...
2025-08-12破解游戏用户流失困局:从数据洞察到留存策略 在游戏行业竞争白热化的当下,用户流失率已成为衡量产品健康度的核心指标。一款游 ...
2025-08-11数据时代的黄金入场券:CDA 认证解锁职业新蓝海 一、万亿级市场需求下的数据分析人才缺口 在数字化转型浪潮中,数据已成为企业核 ...
2025-08-11DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08