京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据与人才的发现评价_数据分析师
马云说,当我们还没有弄清什么是个人计算机的时候,互联网就来了;当我们还没有弄清什么是互联网的时候,大数据就来了。世界变化太快,以至难以追赶。那么,对于人才工作者来说,应该采取怎样的行动呢?笔者认为,就是一定要善于学习,学习如何在大数据云图下思考,在大数据条件下工作,开拓人才工作的新局面。
目前,对于什么叫大数据,以及大到什么程度才叫大数据,数据科学家的认识还未统一。有一种意见认为,在不同的领域应该有所不同。但是,大数据有几个特征是明显的:一是“非样本”而是全部,二是“非结构”且组成复杂,三是时时刻刻变动不息。按照这样一种精神来观察人才工作,笔者认为是可以在以下三方面,对人才发现评价方面有所推进。
筛选发现人才
全世界每天都有大量学术论文发表,因此,把他们集中起来分类录入就不是一件难事。为了从中选拔出优异者,可以让同行专家投票,也可以采取别的替代方法。于是,美国科学家想到了“科学论文引用率”。就是考察科学论文被他人引用的状况,又叫作“引用指数法”。这个方法的产生与持续,确实帮助世界科学界筛选评价出不少杰出科学家,因此风行至今。
海量的论文,到底哪一篇创新性强、学术影响大?把它找出来,并不是一件容易之事,人们动脑筋把这个问题解决了。论文引用这个事情虽然近期遭到一些诟病,但并非方法本身,而是操作问题。就方法而言,还是科学可行的。
最近,国际知名的汤森路透公司,就是利用这种方法准确筛选而发现诺贝尔奖花落谁家的。汤森路透的专家说,他们的方法就是凭借大数据。只要打开汤森路透公司的网站,你就可以看到不少各种各样的人才排行榜,分专业、分行业,分区域,分国家。
选出各行各业的优秀人才,并且将他们按照一定的规则排队,是一件意义重大的事情,是人才工作领导部门的一项基本功。例如,通过它可以帮助我们找到有限资金的资助重点,而不至于“到处撒一些胡椒面”,不仅能够提升资金的使用效率,而且避免了人情关系。
汤森路透公司称,利用大数据方法,他们成功预测也就是发现了去年的8位诺贝尔奖获得者,准确率高达8/11,也就是72.7%。
比较锁定人才
在美国,不少人喜欢看棒球。如何组织好一支棒球队就成为一种学问。比利·比恩是一位棒球队的经理,自然常常思考这个问题。一般经理寻找优秀球员都依靠猎头公司,他则不然,他是找来一位统计学家前来帮忙,而且尽量将球员的各种能力数据化,并以此作为衡量球员的唯一标准。
可以想到,不同的棒球经理对于什么叫“优秀”都有自己的独特理解。比利·比恩则通过他与统计学家共同研制的这套计算机程序和数学模型,专门寻找那些实际价值被低估了的球员,目的是实现最高的“投入产出比”。这么一来,他做到了以有限的投资,寻找最适宜的人才,终于创下了美国历史上职业棒球大联盟连胜20场的空前纪录。
大数据专家认为,比利·比恩是靠胜人一筹的人才评价软件提升了找寻精度,打败众猎头而以智取胜的。可见,就是依靠同一种原理方法,也有评价技术与思路的高低优劣之分。
排序评价人才
大数据特别重视事物的相关性。这种相关,可能距离较远,也可能距离较近。最近面世的两本新书《唐诗排行榜》与《宋词排行榜》,我认为就是利用了大数据原理而实现诗歌排行的新尝试。虽然书名叫作诗词的排行榜,实际上,也对诗家、词家做出了排队。
众所周知,对于唐诗宋词,人各有爱。有人喜欢李白的浪漫,有人热爱杜甫的现实;有人称赞辛弃疾的豪放慷慨,有人偏爱李清照的婉约多情。也就是说,诗词界没有最高法院,不好评论高低上下。但是,从古至今,人们不住地吟诵评论,总有一个名次之分把?于是有人开始采用新的数学统计方法进行研究,以上两本专著就是凭借方法创新实现的产品创新。
评价者采用了四个方面的数据:历代选本入选唐诗的数据、历代点评唐诗的数据、20世纪研究唐诗论文的数据,以及文学史著作选介唐诗的数据。此外,还参考了网络连接的唐诗数据。数据采集后,研究者进行了加权处理以及标准化处理,通过数学变换消除各项指标量纲的差异。这么一来,就可以得到一个计算公式,而后通过计算机自动计算出每首诗的综合得分。这样,位居前一百名的唐诗名篇就排列出来了。结果,高居榜首的是崔颢的《黄鹤楼》。第二至第五名分别为王维的《送元二使安西》,王之涣的《凉州词(黄河远上)》,王之涣的《登鹳雀楼》,杜甫《登岳阳楼》。前10名内出现了柳宗元、孟浩然、常健、王勃、李白的名篇。但是,如果全面仔细观察,在这100首唐诗之内,按出现的诗歌篇数排队,杜甫、王维和李白高居前三。
这告诉我们,按最负盛名的诗歌排队,崔浩、王维、王之涣依次排列,但按照最负盛名的诗人排队,却成了杜甫、王维、李白遥遥领先。本来是要排行唐诗的,一转身,诗歌创作人才的排行也自然呈现出来了,这是因为二者具有很高的相关性。我想说的是,这种排序方法,对于各行各业的人才发现评价具有相当的启发意义。
结语:人才发现与评价的方法途径大致有三:成果鉴定法、同行认可法、大数据法。以上我们是从大数据思维的角度,对人才发现评价进行了一些初步探讨。限于对大数据的理解不够,很可能没有把问题讲清楚。但是,我们从中能够感受到的是,运用大数据方法发现评价人才,需要的是三种能力:计算机云计算技术能力,数据收集与挖掘能力,还有实施人才管理能力。三种能力密切配合方能发挥作用,达到目的。人才发现与人才评价是既一分为二又合二为一的。只有发现了人才,才能实施评价,而发现者又总是具有一定衡量标准的。社会生活实际中,人才是有“潜显”之分,能够通过不同方法发现“潜人才”,才是可贵的真本事。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10