京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据创新信息化测评方法
目前信息化评测方法基本上是从传统的统计方法延续过来的,其数据主要来自两个方面:各地区政府管理部门上报数据和有关部门的抽样调查。但是,这两种数据来源对于评价地区信息化水平来说,都存在一定的问题。
政府部门提供的数据容易偏重于建设方面,如信息化建设投资了多少、铺设了多少皮长公里光纤、建设了多少数据库、存储了多少数据资源等等,这些数据只能反映政府在信息化建设上做了多少工作,而不能反映信息化的应用效果;利用抽样调查取得的数据也有问题,原因在于样本很难随机抽样、问卷设计难以规范、用户回答的随意性太大,满意度很难作为客观的评价指标。
同时,在评测信息化水平的指标选择上也存在一些问题:指标陈旧、更新不及时、跟不上信息技术环境的变化等。例如移动互联网、电子商务、云计算、物联网等应用很难纳入统计。
总之,传统的统计方式适合于纵向历史数据比较,很难适应以横向比较为主的快速变化的信息化形势。为了能够相对客观地比较各地区信息化发展水平,应当尽量使用一些计算机产生的数据,减少人为随意性带来的不确定性。因此,对于信息化的评测,需要另辟蹊径。
利用大数据方法获取数据
应当看到,地区的信息化水平并不等于信息化建设投资的规模,也不等于信息系统能够提供的功能。城市的信息化水平主要是指信息化应用的普及率、应用深度及应用效益水平。信息化应用水平,尤其是应用效益是不可控的,政府可以建设许多项目,但公众是否愿意使用则是另一回事。应用普及是公众的自主选择的结果,一项对公众帮助不大的服务,用户肯定门可罗雀,用户规模更能反映信息化建设的效果。城市信息化水平的调查重点应当是应用规模。注重最终用户效益的统计调查,有利于管理者重视整体效益,重视各方面环境的配套,也有益于智慧的城市建设。
为提高数据获取的效率、增加数据的客观性,我们应当充分利用大数据的方法对传统方法进行改进。信息技术普及到今天,很多应用数据都能够通过自动化的渠道来获取,需要选择的指标不需要太多,多则惑,少则得。GDP之所以受到人们的关注,最重要的原因就是简单。因此,信息化的评测数据也要力求简单,便于普及与推广,只要能够说明问题,指标数目少一些更好。
大数据可以有以下几个来源:搜索网站(如百度)、信用卡公司(如银联)、电子商务公司(如阿里巴巴)、运营商(三大运营商均可)以及可提供政府网站点击率、市民卡使用率的机构。这些企业与机构提供的数据都是由计算机自动生成的,没有人为干预,数据规范而客观,对于评价地区信息化发展水平是很好的参考资料。
五大参数反映信息化水平
从数据获取的难易性和客观真实性出发考虑,笔者建议利用五大“利用率”指标来评测一个地方的信息化发展水平,这5个利用率分别是信息资源利用率、智能设施利用率、通信设施利用率、政府网站利用率和电子商务利用率。
信息资源利用率:主要数据来源是百度的搜索引擎,可以方便地统计出全国每一地区的搜索量,得出各地区网民的平均信息资源的利用能力,内容可进一步分为信息类、娱乐类、电子商务类。
智能设施利用率:包括银行卡刷卡量、市民卡刷卡量、交通卡刷卡量。这三类数据都较容易获取,人均智能卡使用率能够比较准确地反映城市智能设施的应用效果。
通信设施利用率:主要是地区通信数量,包括3G通信的比例,人均通信量越高的城市,信息化水平越高。通信量还包括城市进出人口的通信统计,可以反映城市人口的流动率,人口流动率也是反映城市信息化水平的重要数据。
政府网站利用率:政府网站点击率能够反映政府电子政务被使用的效果,电子政务网站向城市居民渗透率是评价电子政务效果的重要指标,这个数据并不难得到,分析这些数据对电子政务改进很有价值。
电子商务利用率:电子商务利用率也是评价一个地区信息化水平的重要指标,该数据可以向阿里巴巴订购,可以比较一个城市的电子商务普及率、物流覆盖率、居民消费能力,电子商务统计数据对于比较各地信息化水平十分重要。
上述数据除以地区人口数,即得到相应的信息化参数值。这些数据都是来自计算机的自动统计,在通过数据分析师的进一步整理,因而有着更好的客观性。如果有机构能够将这些数据组织为完整的系统向全国发布,对于各地政府的智慧城市建设会有很大帮助;而承担这项工作的机构有无行政权力并不重要,重要的是创意与合作能力,政府、民间都可以做,或许民间机构会做得更好。
将各地区信息化数据加工成为一个指数来进行信息化统一排名的必要性不是很大,因为各地区环境差异太大。但是,分类的排序却很有好处,有助于各地区看到具体的差距,以便于改进。将这五个参数用雷达图表达会更加直观,从雷达图上可以看出本地区信息化发展的薄弱环节,有助于地方政府改进工作。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07