京公网安备 11010802034615号
经营许可证编号:京B2-20210330
研究机构比企业更缺大数据专业人才
为了能够及时应对大数据时代带来的挑战,国内学术界最近有着不少新动静。中科院院士马志明近日就发表了这样的声明,上月他几乎每个礼拜都可以看到一家全新的、和大数据相关的研究机构或研究平台诞生。从中科院系统内部培育的重点实验室到国家基金委的“双清论坛”,再到日前上海财经大学携手国家统计局成立“大数据统计科学中心”—一个信号已经非常清晰:对大数据的深挖和系统研究,已是板上钉钉的国家性质的结构战略。
“在大数据时代,数据科学家和数据工程师非常紧缺。”根据一些机构的测算,未来5年,国内各行各业需要的大数据专业人才,缺口将高达1000万左右。
对海量数据信息的处理手段还远不够
大数据正给各行各业带来巨变。以保险业的车险为例,如果在每辆汽车上加载一个行驶监测设备,保险公司就可以轻松掌握每一个用户的车辆使用情况、个人驾驶习惯等。基于这些关键数据,保险公司就可以针对不同的用户“定制”不同的车险品种,从而提高投保的精准率。
上海财经大学统计与管理学院院长周勇教授说,无论是学术界还是企业界都已察觉,大数据是一座“富矿”,对大数据的收集、深挖过程,本身就伴随着很多的发展机会。
但开掘“富矿”并不容易。比如,对海量数据信息的处理手段,目前还远远不够。有业内人士做过测算,假设一个城市有3万个左右摄像头,在不经任何加工的情况下原始保存连续两个月的图像信息,耗资将高达上百亿元人民币。除了要解决数据存储的基础设施问题,如何从海量的图像信息中提取有效信息,也是目前学界正在加紧研究的课题。
“过去10年至15年来,基于互联网的信息技术革命已给全人类带来了颠覆性影响,信息科学从某种程度上说,已成为推动经济发展的一个重要引擎。现在还可以预见的是:在未来的几十年时间里,更多与经济社会发展相关的决策,都会被大数据推着走。”美国普林斯顿大学终身教授、上海财经大学大数据统计科学中心首席科学家范剑青教授说,对大数据的研究固然涉及众多学科、领域,但按照目前美国学术界的共同看法,数学、统计学和计算机科学的三者结合是构成分析、研究大数据的基础。
研究机构比企业更缺大数据专业人才
随着大数据时代的到来,专业数据处理人才已从“走俏”变成“紧缺”。“过去我们的毕业生一般喜欢到金融机构、保险机构等单位就业,做一些和数据分析相关的工作。但现在,互联网公司、大型药企都开出高薪抢人。”周勇说。颇有意思的是,来自企业的高薪揽才,客观上让学术界“尴尬”:“现在最需要、最缺少大数据专业人才的其实是高校和研究机构。高起点、高水平的研究亟需高层次的人才加盟,但因为科研机构的待遇不如企业,留住人才成了一桩难事。”
大数据“捧红”了作为传统学科的统计学;但另一方面,统计学受到的来自大数据的挑战,也比其他学科要猛烈得多。
“在大数据时代,很多传统的数据收集方法、统计方法显得失效,而且用统计的手段进行经济预测的功能,也出现了根本性的变革。”据介绍,国家统计局目前已经在和百度、阿里巴巴等互联网公司合作,深度开发挖掘大量实时在线的搜索数据,从而提升统计数据的准确性和及时性。过去,统计数据对经济走势预测、对宏观决策的作用往往是“用过去的经验来预测未来”,而今后,“经济雷达”在预测、预警时发挥的功效会显得更具时效性。
“有了互联网、大数据,收集信息的渠道和时效明显增强,无论是专业的统计部门还是智库,不用再为拿不到真实数据而烦恼了。”也有一位统计学专家告诉记者,虽然数据来源多样、获取渠道多样是大数据时代的“红利”,但它同时也滋生出信息安全、用户隐私权保护方面的新问题。
“学界与业界对大数据带来的变革和挑战有不同层次的关注、感受,业界有强烈的问题驱动,学界则对面临的学术任务非常明晰。”上海财经大学校长樊丽明说,上海财大此次联合国家统计局成立“大数据统计科学中心”,初衷就是聚焦国家战略,形成在大数据研究、社会经济统计等领域的合作研究项目,以学校的优势学科服务上海科创中心建设。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21