京公网安备 11010802034615号
经营许可证编号:京B2-20210330
研究机构比企业更缺大数据专业人才
为了能够及时应对大数据时代带来的挑战,国内学术界最近有着不少新动静。中科院院士马志明近日就发表了这样的声明,上月他几乎每个礼拜都可以看到一家全新的、和大数据相关的研究机构或研究平台诞生。从中科院系统内部培育的重点实验室到国家基金委的“双清论坛”,再到日前上海财经大学携手国家统计局成立“大数据统计科学中心”—一个信号已经非常清晰:对大数据的深挖和系统研究,已是板上钉钉的国家性质的结构战略。
“在大数据时代,数据科学家和数据工程师非常紧缺。”根据一些机构的测算,未来5年,国内各行各业需要的大数据专业人才,缺口将高达1000万左右。
对海量数据信息的处理手段还远不够
大数据正给各行各业带来巨变。以保险业的车险为例,如果在每辆汽车上加载一个行驶监测设备,保险公司就可以轻松掌握每一个用户的车辆使用情况、个人驾驶习惯等。基于这些关键数据,保险公司就可以针对不同的用户“定制”不同的车险品种,从而提高投保的精准率。
上海财经大学统计与管理学院院长周勇教授说,无论是学术界还是企业界都已察觉,大数据是一座“富矿”,对大数据的收集、深挖过程,本身就伴随着很多的发展机会。
但开掘“富矿”并不容易。比如,对海量数据信息的处理手段,目前还远远不够。有业内人士做过测算,假设一个城市有3万个左右摄像头,在不经任何加工的情况下原始保存连续两个月的图像信息,耗资将高达上百亿元人民币。除了要解决数据存储的基础设施问题,如何从海量的图像信息中提取有效信息,也是目前学界正在加紧研究的课题。
“过去10年至15年来,基于互联网的信息技术革命已给全人类带来了颠覆性影响,信息科学从某种程度上说,已成为推动经济发展的一个重要引擎。现在还可以预见的是:在未来的几十年时间里,更多与经济社会发展相关的决策,都会被大数据推着走。”美国普林斯顿大学终身教授、上海财经大学大数据统计科学中心首席科学家范剑青教授说,对大数据的研究固然涉及众多学科、领域,但按照目前美国学术界的共同看法,数学、统计学和计算机科学的三者结合是构成分析、研究大数据的基础。
研究机构比企业更缺大数据专业人才
随着大数据时代的到来,专业数据处理人才已从“走俏”变成“紧缺”。“过去我们的毕业生一般喜欢到金融机构、保险机构等单位就业,做一些和数据分析相关的工作。但现在,互联网公司、大型药企都开出高薪抢人。”周勇说。颇有意思的是,来自企业的高薪揽才,客观上让学术界“尴尬”:“现在最需要、最缺少大数据专业人才的其实是高校和研究机构。高起点、高水平的研究亟需高层次的人才加盟,但因为科研机构的待遇不如企业,留住人才成了一桩难事。”
大数据“捧红”了作为传统学科的统计学;但另一方面,统计学受到的来自大数据的挑战,也比其他学科要猛烈得多。
“在大数据时代,很多传统的数据收集方法、统计方法显得失效,而且用统计的手段进行经济预测的功能,也出现了根本性的变革。”据介绍,国家统计局目前已经在和百度、阿里巴巴等互联网公司合作,深度开发挖掘大量实时在线的搜索数据,从而提升统计数据的准确性和及时性。过去,统计数据对经济走势预测、对宏观决策的作用往往是“用过去的经验来预测未来”,而今后,“经济雷达”在预测、预警时发挥的功效会显得更具时效性。
“有了互联网、大数据,收集信息的渠道和时效明显增强,无论是专业的统计部门还是智库,不用再为拿不到真实数据而烦恼了。”也有一位统计学专家告诉记者,虽然数据来源多样、获取渠道多样是大数据时代的“红利”,但它同时也滋生出信息安全、用户隐私权保护方面的新问题。
“学界与业界对大数据带来的变革和挑战有不同层次的关注、感受,业界有强烈的问题驱动,学界则对面临的学术任务非常明晰。”上海财经大学校长樊丽明说,上海财大此次联合国家统计局成立“大数据统计科学中心”,初衷就是聚焦国家战略,形成在大数据研究、社会经济统计等领域的合作研究项目,以学校的优势学科服务上海科创中心建设。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在日常办公数据分析中,我们经常会面对杂乱无章的批量数据——比如员工月度绩效、产品销售数据、客户消费金额、月度运营指标等。 ...
2026-02-05在分类模型(如风控反欺诈、医疗疾病诊断、客户流失预警)的实操落地中,ROC曲线是评估模型区分能力的核心工具,而阈值则是连接 ...
2026-02-05对CDA(Certified Data Analyst)数据分析师而言,数据分析的价值不仅在于挖掘数据背后的规律与洞察,更在于通过专业的报告呈现 ...
2026-02-05在数据分析实战中,我们经常会遇到“多指标冗余”的问题——比如分析企业经营状况时,需同时关注营收、利润、负债率、周转率等十 ...
2026-02-04在数据分析场景中,基准比是衡量指标表现、评估业务成效、对比个体/群体差异的核心工具,广泛应用于绩效评估、业务监控、竞品对 ...
2026-02-04业务数据分析是企业日常运营的核心支撑,其核心价值在于将零散的业务数据转化为可落地的业务洞察,破解运营痛点、优化业务流程、 ...
2026-02-04在信贷业务中,违约率是衡量信贷资产质量、把控信用风险、制定风控策略的核心指标,其统计分布特征直接决定了风险定价的合理性、 ...
2026-02-03在数字化业务迭代中,AB测试已成为验证产品优化、策略调整、运营活动效果的核心工具。但多数业务场景中,单纯的“AB组差异对比” ...
2026-02-03企业战略决策的科学性,决定了其长远发展的格局与竞争力。战略分析方法作为一套系统化、专业化的思维工具,为企业研判行业趋势、 ...
2026-02-03在统计调查与数据分析中,抽样方法分为简单随机抽样与复杂抽样两大类。简单随机抽样因样本均匀、计算简便,是基础的抽样方式,但 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28