京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据与人才的发现评价_数据分析师
马云说,当我们还没有弄清什么是个人计算机的时候,互联网就来了;当我们还没有弄清什么是互联网的时候,大数据就来了。世界变化太快,以至难以追赶。那么,对于人才工作者来说,应该采取怎样的行动呢?笔者认为,就是一定要善于学习,学习如何在大数据云图下思考,在大数据条件下工作,开拓人才工作的新局面。
目前,对于什么叫大数据,以及大到什么程度才叫大数据,数据科学家的认识还未统一。有一种意见认为,在不同的领域应该有所不同。但是,大数据有几个特征是明显的:一是“非样本”而是全部,二是“非结构”且组成复杂,三是时时刻刻变动不息。按照这样一种精神来观察人才工作,笔者认为是可以在以下三方面,对人才发现评价方面有所推进。
筛选发现人才
全世界每天都有大量学术论文发表,因此,把他们集中起来分类录入就不是一件难事。为了从中选拔出优异者,可以让同行专家投票,也可以采取别的替代方法。于是,美国科学家想到了“科学论文引用率”。就是考察科学论文被他人引用的状况,又叫作“引用指数法”。这个方法的产生与持续,确实帮助世界科学界筛选评价出不少杰出科学家,因此风行至今。
海量的论文,到底哪一篇创新性强、学术影响大?把它找出来,并不是一件容易之事,人们动脑筋把这个问题解决了。论文引用这个事情虽然近期遭到一些诟病,但并非方法本身,而是操作问题。就方法而言,还是科学可行的。
最近,国际知名的汤森路透公司,就是利用这种方法准确筛选而发现诺贝尔奖花落谁家的。汤森路透的专家说,他们的方法就是凭借大数据。只要打开汤森路透公司的网站,你就可以看到不少各种各样的人才排行榜,分专业、分行业,分区域,分国家。
选出各行各业的优秀人才,并且将他们按照一定的规则排队,是一件意义重大的事情,是人才工作领导部门的一项基本功。例如,通过它可以帮助我们找到有限资金的资助重点,而不至于“到处撒一些胡椒面”,不仅能够提升资金的使用效率,而且避免了人情关系。
汤森路透公司称,利用大数据方法,他们成功预测也就是发现了去年的8位诺贝尔奖获得者,准确率高达8/11,也就是72.7%。
比较锁定人才
在美国,不少人喜欢看棒球。如何组织好一支棒球队就成为一种学问。比利·比恩是一位棒球队的经理,自然常常思考这个问题。一般经理寻找优秀球员都依靠猎头公司,他则不然,他是找来一位统计学家前来帮忙,而且尽量将球员的各种能力数据化,并以此作为衡量球员的唯一标准。
可以想到,不同的棒球经理对于什么叫“优秀”都有自己的独特理解。比利·比恩则通过他与统计学家共同研制的这套计算机程序和数学模型,专门寻找那些实际价值被低估了的球员,目的是实现最高的“投入产出比”。这么一来,他做到了以有限的投资,寻找最适宜的人才,终于创下了美国历史上职业棒球大联盟连胜20场的空前纪录。
大数据专家认为,比利·比恩是靠胜人一筹的人才评价软件提升了找寻精度,打败众猎头而以智取胜的。可见,就是依靠同一种原理方法,也有评价技术与思路的高低优劣之分。
排序评价人才
大数据特别重视事物的相关性。这种相关,可能距离较远,也可能距离较近。最近面世的两本新书《唐诗排行榜》与《宋词排行榜》,我认为就是利用了大数据原理而实现诗歌排行的新尝试。虽然书名叫作诗词的排行榜,实际上,也对诗家、词家做出了排队。
众所周知,对于唐诗宋词,人各有爱。有人喜欢李白的浪漫,有人热爱杜甫的现实;有人称赞辛弃疾的豪放慷慨,有人偏爱李清照的婉约多情。也就是说,诗词界没有最高法院,不好评论高低上下。但是,从古至今,人们不住地吟诵评论,总有一个名次之分把?于是有人开始采用新的数学统计方法进行研究,以上两本专著就是凭借方法创新实现的产品创新。
评价者采用了四个方面的数据:历代选本入选唐诗的数据、历代点评唐诗的数据、20世纪研究唐诗论文的数据,以及文学史著作选介唐诗的数据。此外,还参考了网络连接的唐诗数据。数据采集后,研究者进行了加权处理以及标准化处理,通过数学变换消除各项指标量纲的差异。这么一来,就可以得到一个计算公式,而后通过计算机自动计算出每首诗的综合得分。这样,位居前一百名的唐诗名篇就排列出来了。结果,高居榜首的是崔颢的《黄鹤楼》。第二至第五名分别为王维的《送元二使安西》,王之涣的《凉州词(黄河远上)》,王之涣的《登鹳雀楼》,杜甫《登岳阳楼》。前10名内出现了柳宗元、孟浩然、常健、王勃、李白的名篇。但是,如果全面仔细观察,在这100首唐诗之内,按出现的诗歌篇数排队,杜甫、王维和李白高居前三。
这告诉我们,按最负盛名的诗歌排队,崔浩、王维、王之涣依次排列,但按照最负盛名的诗人排队,却成了杜甫、王维、李白遥遥领先。本来是要排行唐诗的,一转身,诗歌创作人才的排行也自然呈现出来了,这是因为二者具有很高的相关性。我想说的是,这种排序方法,对于各行各业的人才发现评价具有相当的启发意义。
结语:人才发现与评价的方法途径大致有三:成果鉴定法、同行认可法、大数据法。以上我们是从大数据思维的角度,对人才发现评价进行了一些初步探讨。限于对大数据的理解不够,很可能没有把问题讲清楚。但是,我们从中能够感受到的是,运用大数据方法发现评价人才,需要的是三种能力:计算机云计算技术能力,数据收集与挖掘能力,还有实施人才管理能力。三种能力密切配合方能发挥作用,达到目的。人才发现与人才评价是既一分为二又合二为一的。只有发现了人才,才能实施评价,而发现者又总是具有一定衡量标准的。社会生活实际中,人才是有“潜显”之分,能够通过不同方法发现“潜人才”,才是可贵的真本事。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23