京公网安备 11010802034615号
经营许可证编号:京B2-20210330
走出大数据的“大”的误区,大数据不在数据之大
“大数据”已经成为21世纪商业的代名词。聚拢大量数据的浪潮正变得愈加猛烈。公司无论所属行业和规模大小,都竭力想要实现招聘自动化,将流程数字化,并且打造出客户和求职者的信息库。企业管理层必须面对的问题不在于收集了多少数据,而在于是否拥有恰当的数据,以及如何解读这些数据。
大数据太大?
麦克斯维尔·韦塞尔(Maxwell Wessel)在《哈佛商业评论》的一篇文章中说,我们用来捕捉信息的网正一天天地越铺越大。可能影响到招聘或管理劳动力的所有因素似乎都被一网打尽。
“利用大量的社会、天气和政府数据预测供应链中断。”韦塞尔写道,“利用大量的用户数据在汪洋般的网站点击中识别个人用户。企业甚至开始利用海量的文字交流信息来开发能够和客户对话的电脑算法。”
如今,这一切在行业内均有发生,甚至已将人工智能(AI)用作为招聘工具。FirstJob推出了Mya,这款AI系统利用自然语言处理和机器学习,旨在令75%的招聘过程实现自动化。
与亚马逊(Amazon)的Alexa和苹果(Apple)的Siri等虚拟助理一样,Mya也能模拟对话,和用户进行复杂一点的互动。通过这些交流,Mya可以不断收集求职者的数据,比如他们的技能、敬业度、文化契合度等等,然后将这些数据被转换成可量化的情报。
由于Mya才刚刚面世,其效果还有待观察。但问题依旧:在Mya从无数求职者那里收集的大量信息中,有多少是有用的?有多少是可执行的?有多少是多余的?
小而恰当的数据据佳例Uber
尽管毁誉参半,但Uber的确成功展现了数据分析的力量。投资者和商业专家早就把这款按需网约车应用称为大数据的楷模。Uber会从司机和乘客那里收集大量信息,按照韦塞尔的说法,这使它能够规划“人类交通的实时物流”。然而,韦塞尔也指出了Uber数据真实规模的一个关键性的特点。
威塞尔说:“Uber的成功并不在于它收集的大量数据,而是来自截然不同的方向:小而恰当的数据。Uber就是利用这样的数据来调度车辆。”
在Uber急速崛起之前,乘客是靠出租车来实现类似的服务。韦塞尔说,虽然没有电脑收集和处理数据,但“在城市街道上用眼睛搜索潜在乘客”的做法本身就是一种收集和分析数据的大型程序。
“尽管计算发生在人脑内部,但被收集和分析的数据量并没有不同。”他说,“Uber巧妙的解决方案就是不再对视觉数据应用生物异常探测算法,而是利用恰当数据来完成这项任务。谁需要打车?他们在哪里?这些至关重要的信息让Uber、Lyft和滴滴出行等公司彻底改革了一个行业。”
恰当调整你的大数据规模
1识别浪费
想要弄清楚数据的恰当规模,关键是识别“浪费”。韦塞尔以花店为例。普通零售花店的损耗率高达50%,这意味着一半的漂亮花束还没有卖出去就被扔进垃圾箱。不过,浪费却是机遇的一个宝贵来源。
“无论是工业生产、零售还是法律调查,应该弄清楚精力和资源遭到浪费的源头,以此找出迈向恰当数据的方向。”韦塞尔写道。
对于领导层来说,在确定恰当的人才数据时,第一步就是找出浪费掉的精力或者无用的流程。假设你的工作应聘率为1:5或更低,这就意味着你的招聘人员或者招聘合作方收到的简历不够多。于是你就找出了“浪费”的源头和改善流程的机会。
2减少浪费
这时,你决定将重点放在减少浪费上,想办法改变流程,防止精力被浪费或者无效。还是以工作应聘率问题为例,我们需要开始积累、分析和合成与这个问题有关的数据。
职位描述写得怎么样?是否有吸引力?对客户和应聘者双方来说,是否都准确反映了该职位的要求和福利?
是否利用了恰当的招聘渠道?如果传统的招聘渠道效果不好,那就分析社交网络、在线群体、社区、大学系统和其他媒介的数据。也许LinkedIn和Facebook是比全球最大招聘网站Monster更好的招聘渠道。
招聘宣传做得怎么样?这个过程是人工完成的吗?能不能实现自动化?
对比失败的开端或者应聘者寥寥无几的场面,那些成功的招聘工作又是怎么样的?分析这些数据将帮助你从中吸取经验。
3建立有意义的数据集
着眼全局,思考数据如何影响整间公司和所有员工。
防范确认性偏见。像《流言终结者》节目主持人那样进行分析。尝试推翻被广泛接受的标准。敢于承担风险、失败和意外结果。所有这些都是重要的学习经历,将会帮助你改善流程。
利用可靠、有效、干净和完整的数据集。数据应该是客观的,而不是仅仅基于特定的商业团体、人才类别、公司部门或者招聘经理。
进行跨团体、跨时间的比较。
4立刻让盟友、利益相关者和合作伙伴参与进来
如果利益相关者不知情,没有参与进来,那么即使是考虑最全面、执行最到位的分析也可能失败。让其他人也加入这趟发现之旅,向他们征求意见。你会发现,被赋予了决策权的人往往更愿意参与其中,检查研究结果,了解其价值,落实修改意见。如果忽视这一点,所有努力都可能付之东流。
要是没有事先告知和参与,此过程中的其他利益相关者可能会觉得有人在对自己的工作指手画脚,尤其是在他们认为自己明明做得很好的情况下。尽管另一方面的用意是好的,但被动接受者会觉得自己被蒙在了鼓里。如果发生这样的事情,重要的计划可能却会应者寥寥,得不到落实,这相当于是在浪费机会、时间和金钱。
5创建数据团队
创建恰当的数据团队是必要之举,在收集和分析数据之前就应该着手进行。虽然在项目经理的头脑和追踪系统(比如VMS、ATS、企业资源系统等等)里,存放着堆积如山的有用数据,但必须通过多方协作才能作出周详的决定。最好的数据团队应该具有广泛的代表性。在项目中,应该包含来自客户组织、MSP、VMS和招聘合作公司的专业人士。我们需要这些主题专家来解决项目的“为什么”、“是什么”和“怎么做”。
“为什么”团队:招聘经理、运营主管和公司高管,他们提供商业技能。
“是什么”团队:招聘合作方、采购主管和人事专员,他们提供人力资源方面的技能。
“怎么做”团队:来自临时工企业、客户单位和技术提供商(比如VMS)的数据分析专家,他们知道如何收集信息,如何把信息转换成有意义的结论供决策者参考。
更为重要的是,确保数据团队体现多样化的想法和观点。很多企业认为自己是数据驱动型企业,重度依赖收集自多个信息源的信息,比如客户、员工、供应商等。但如果数据团队成员有太多的共同点(比如来自同一个部门),那么他们对数据的解读常常会带有偏见、过于简单、过于宽泛或者倾向于证明一个假设,而不是揭示一项事实。
再以工作应聘率为例。如果负责收集数据的人同时也是寻找或招聘求职者的人,那么他们最终会陷入防御心态。在这种情况下,他们往往会寻找数据来为他们的挫折辩护。或者,他们过度纠结于应该检查应聘者的哪些方面。而如果数据团队成员来自人力资源、营销、运营和招聘合作方等多种立场呢?引入临时工项目其他方面的利益相关者后,你会更加清楚地知道问题所在,找到解决办法。
找到恰当数据的“甜区”
韦塞尔在文章中写道:“恰当数据有时很大,有时很小。但对创新者来说,关键是弄明白哪些是能够提升竞争力的关键性数据。这些数据就是你应该积极探寻的恰当数据。”
关于项目(无论大小)的数据能把我们以前从来不知道的优秀人才和创新者呈现在我们眼前。我们只需要确保自己看向恰当的地方,翻开恰当的石头。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28随着大数据技术的快速普及,各行各业积累了海量的用户数据、交易数据、生产数据与行为数据。单纯的数据统计与报表分析只能呈现表 ...
2026-05-28在Python网络请求、接口测试、数据爬取、业务对接开发中,Requests库是最简洁、最高效的HTTP请求工具,凭借简洁的语法、完善的适 ...
2026-05-272025 年,零售与服务行业的竞争已从 “经验驱动” 全面转向 “数据驱动”。中小企业门店普遍面临数据零散、分析浅层、决策凭感觉 ...
2026-05-27 很多数据分析师每天都在写SQL,但当被问到“数据查询语言(DQL)的本质是什么”“SELECT语句中各子句的书写顺序与实际执行顺 ...
2026-05-27在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21