
大数据与人才的发现评价_数据分析师
马云说,当我们还没有弄清什么是个人计算机的时候,互联网就来了;当我们还没有弄清什么是互联网的时候,大数据就来了。世界变化太快,以至难以追赶。那么,对于人才工作者来说,应该采取怎样的行动呢?笔者认为,就是一定要善于学习,学习如何在大数据云图下思考,在大数据条件下工作,开拓人才工作的新局面。
目前,对于什么叫大数据,以及大到什么程度才叫大数据,数据科学家的认识还未统一。有一种意见认为,在不同的领域应该有所不同。但是,大数据有几个特征是明显的:一是“非样本”而是全部,二是“非结构”且组成复杂,三是时时刻刻变动不息。按照这样一种精神来观察人才工作,笔者认为是可以在以下三方面,对人才发现评价方面有所推进。
筛选发现人才
全世界每天都有大量学术论文发表,因此,把他们集中起来分类录入就不是一件难事。为了从中选拔出优异者,可以让同行专家投票,也可以采取别的替代方法。于是,美国科学家想到了“科学论文引用率”。就是考察科学论文被他人引用的状况,又叫作“引用指数法”。这个方法的产生与持续,确实帮助世界科学界筛选评价出不少杰出科学家,因此风行至今。
海量的论文,到底哪一篇创新性强、学术影响大?把它找出来,并不是一件容易之事,人们动脑筋把这个问题解决了。论文引用这个事情虽然近期遭到一些诟病,但并非方法本身,而是操作问题。就方法而言,还是科学可行的。
最近,国际知名的汤森路透公司,就是利用这种方法准确筛选而发现诺贝尔奖花落谁家的。汤森路透的专家说,他们的方法就是凭借大数据。只要打开汤森路透公司的网站,你就可以看到不少各种各样的人才排行榜,分专业、分行业,分区域,分国家。
选出各行各业的优秀人才,并且将他们按照一定的规则排队,是一件意义重大的事情,是人才工作领导部门的一项基本功。例如,通过它可以帮助我们找到有限资金的资助重点,而不至于“到处撒一些胡椒面”,不仅能够提升资金的使用效率,而且避免了人情关系。
汤森路透公司称,利用大数据方法,他们成功预测也就是发现了去年的8位诺贝尔奖获得者,准确率高达8/11,也就是72.7%。
比较锁定人才
在美国,不少人喜欢看棒球。如何组织好一支棒球队就成为一种学问。比利·比恩是一位棒球队的经理,自然常常思考这个问题。一般经理寻找优秀球员都依靠猎头公司,他则不然,他是找来一位统计学家前来帮忙,而且尽量将球员的各种能力数据化,并以此作为衡量球员的唯一标准。
可以想到,不同的棒球经理对于什么叫“优秀”都有自己的独特理解。比利·比恩则通过他与统计学家共同研制的这套计算机程序和数学模型,专门寻找那些实际价值被低估了的球员,目的是实现最高的“投入产出比”。这么一来,他做到了以有限的投资,寻找最适宜的人才,终于创下了美国历史上职业棒球大联盟连胜20场的空前纪录。
大数据专家认为,比利·比恩是靠胜人一筹的人才评价软件提升了找寻精度,打败众猎头而以智取胜的。可见,就是依靠同一种原理方法,也有评价技术与思路的高低优劣之分。
排序评价人才
大数据特别重视事物的相关性。这种相关,可能距离较远,也可能距离较近。最近面世的两本新书《唐诗排行榜》与《宋词排行榜》,我认为就是利用了大数据原理而实现诗歌排行的新尝试。虽然书名叫作诗词的排行榜,实际上,也对诗家、词家做出了排队。
众所周知,对于唐诗宋词,人各有爱。有人喜欢李白的浪漫,有人热爱杜甫的现实;有人称赞辛弃疾的豪放慷慨,有人偏爱李清照的婉约多情。也就是说,诗词界没有最高法院,不好评论高低上下。但是,从古至今,人们不住地吟诵评论,总有一个名次之分把?于是有人开始采用新的数学统计方法进行研究,以上两本专著就是凭借方法创新实现的产品创新。
评价者采用了四个方面的数据:历代选本入选唐诗的数据、历代点评唐诗的数据、20世纪研究唐诗论文的数据,以及文学史著作选介唐诗的数据。此外,还参考了网络连接的唐诗数据。数据采集后,研究者进行了加权处理以及标准化处理,通过数学变换消除各项指标量纲的差异。这么一来,就可以得到一个计算公式,而后通过计算机自动计算出每首诗的综合得分。这样,位居前一百名的唐诗名篇就排列出来了。结果,高居榜首的是崔颢的《黄鹤楼》。第二至第五名分别为王维的《送元二使安西》,王之涣的《凉州词(黄河远上)》,王之涣的《登鹳雀楼》,杜甫《登岳阳楼》。前10名内出现了柳宗元、孟浩然、常健、王勃、李白的名篇。但是,如果全面仔细观察,在这100首唐诗之内,按出现的诗歌篇数排队,杜甫、王维和李白高居前三。
这告诉我们,按最负盛名的诗歌排队,崔浩、王维、王之涣依次排列,但按照最负盛名的诗人排队,却成了杜甫、王维、李白遥遥领先。本来是要排行唐诗的,一转身,诗歌创作人才的排行也自然呈现出来了,这是因为二者具有很高的相关性。我想说的是,这种排序方法,对于各行各业的人才发现评价具有相当的启发意义。
结语:人才发现与评价的方法途径大致有三:成果鉴定法、同行认可法、大数据法。以上我们是从大数据思维的角度,对人才发现评价进行了一些初步探讨。限于对大数据的理解不够,很可能没有把问题讲清楚。但是,我们从中能够感受到的是,运用大数据方法发现评价人才,需要的是三种能力:计算机云计算技术能力,数据收集与挖掘能力,还有实施人才管理能力。三种能力密切配合方能发挥作用,达到目的。人才发现与人才评价是既一分为二又合二为一的。只有发现了人才,才能实施评价,而发现者又总是具有一定衡量标准的。社会生活实际中,人才是有“潜显”之分,能够通过不同方法发现“潜人才”,才是可贵的真本事。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29