
走出大数据的“大”的误区,大数据不在数据之大
“大数据”已经成为21世纪商业的代名词。聚拢大量数据的浪潮正变得愈加猛烈。公司无论所属行业和规模大小,都竭力想要实现招聘自动化,将流程数字化,并且打造出客户和求职者的信息库。企业管理层必须面对的问题不在于收集了多少数据,而在于是否拥有恰当的数据,以及如何解读这些数据。
大数据太大?
麦克斯维尔·韦塞尔(Maxwell Wessel)在《哈佛商业评论》的一篇文章中说,我们用来捕捉信息的网正一天天地越铺越大。可能影响到招聘或管理劳动力的所有因素似乎都被一网打尽。
“利用大量的社会、天气和政府数据预测供应链中断。”韦塞尔写道,“利用大量的用户数据在汪洋般的网站点击中识别个人用户。企业甚至开始利用海量的文字交流信息来开发能够和客户对话的电脑算法。”
如今,这一切在行业内均有发生,甚至已将人工智能(AI)用作为招聘工具。FirstJob推出了Mya,这款AI系统利用自然语言处理和机器学习,旨在令75%的招聘过程实现自动化。
与亚马逊(Amazon)的Alexa和苹果(Apple)的Siri等虚拟助理一样,Mya也能模拟对话,和用户进行复杂一点的互动。通过这些交流,Mya可以不断收集求职者的数据,比如他们的技能、敬业度、文化契合度等等,然后将这些数据被转换成可量化的情报。
由于Mya才刚刚面世,其效果还有待观察。但问题依旧:在Mya从无数求职者那里收集的大量信息中,有多少是有用的?有多少是可执行的?有多少是多余的?
小而恰当的数据据佳例Uber
尽管毁誉参半,但Uber的确成功展现了数据分析的力量。投资者和商业专家早就把这款按需网约车应用称为大数据的楷模。Uber会从司机和乘客那里收集大量信息,按照韦塞尔的说法,这使它能够规划“人类交通的实时物流”。然而,韦塞尔也指出了Uber数据真实规模的一个关键性的特点。
威塞尔说:“Uber的成功并不在于它收集的大量数据,而是来自截然不同的方向:小而恰当的数据。Uber就是利用这样的数据来调度车辆。”
在Uber急速崛起之前,乘客是靠出租车来实现类似的服务。韦塞尔说,虽然没有电脑收集和处理数据,但“在城市街道上用眼睛搜索潜在乘客”的做法本身就是一种收集和分析数据的大型程序。
“尽管计算发生在人脑内部,但被收集和分析的数据量并没有不同。”他说,“Uber巧妙的解决方案就是不再对视觉数据应用生物异常探测算法,而是利用恰当数据来完成这项任务。谁需要打车?他们在哪里?这些至关重要的信息让Uber、Lyft和滴滴出行等公司彻底改革了一个行业。”
恰当调整你的大数据规模
1识别浪费
想要弄清楚数据的恰当规模,关键是识别“浪费”。韦塞尔以花店为例。普通零售花店的损耗率高达50%,这意味着一半的漂亮花束还没有卖出去就被扔进垃圾箱。不过,浪费却是机遇的一个宝贵来源。
“无论是工业生产、零售还是法律调查,应该弄清楚精力和资源遭到浪费的源头,以此找出迈向恰当数据的方向。”韦塞尔写道。
对于领导层来说,在确定恰当的人才数据时,第一步就是找出浪费掉的精力或者无用的流程。假设你的工作应聘率为1:5或更低,这就意味着你的招聘人员或者招聘合作方收到的简历不够多。于是你就找出了“浪费”的源头和改善流程的机会。
2减少浪费
这时,你决定将重点放在减少浪费上,想办法改变流程,防止精力被浪费或者无效。还是以工作应聘率问题为例,我们需要开始积累、分析和合成与这个问题有关的数据。
职位描述写得怎么样?是否有吸引力?对客户和应聘者双方来说,是否都准确反映了该职位的要求和福利?
是否利用了恰当的招聘渠道?如果传统的招聘渠道效果不好,那就分析社交网络、在线群体、社区、大学系统和其他媒介的数据。也许LinkedIn和Facebook是比全球最大招聘网站Monster更好的招聘渠道。
招聘宣传做得怎么样?这个过程是人工完成的吗?能不能实现自动化?
对比失败的开端或者应聘者寥寥无几的场面,那些成功的招聘工作又是怎么样的?分析这些数据将帮助你从中吸取经验。
3建立有意义的数据集
着眼全局,思考数据如何影响整间公司和所有员工。
防范确认性偏见。像《流言终结者》节目主持人那样进行分析。尝试推翻被广泛接受的标准。敢于承担风险、失败和意外结果。所有这些都是重要的学习经历,将会帮助你改善流程。
利用可靠、有效、干净和完整的数据集。数据应该是客观的,而不是仅仅基于特定的商业团体、人才类别、公司部门或者招聘经理。
进行跨团体、跨时间的比较。
4立刻让盟友、利益相关者和合作伙伴参与进来
如果利益相关者不知情,没有参与进来,那么即使是考虑最全面、执行最到位的分析也可能失败。让其他人也加入这趟发现之旅,向他们征求意见。你会发现,被赋予了决策权的人往往更愿意参与其中,检查研究结果,了解其价值,落实修改意见。如果忽视这一点,所有努力都可能付之东流。
要是没有事先告知和参与,此过程中的其他利益相关者可能会觉得有人在对自己的工作指手画脚,尤其是在他们认为自己明明做得很好的情况下。尽管另一方面的用意是好的,但被动接受者会觉得自己被蒙在了鼓里。如果发生这样的事情,重要的计划可能却会应者寥寥,得不到落实,这相当于是在浪费机会、时间和金钱。
5创建数据团队
创建恰当的数据团队是必要之举,在收集和分析数据之前就应该着手进行。虽然在项目经理的头脑和追踪系统(比如VMS、ATS、企业资源系统等等)里,存放着堆积如山的有用数据,但必须通过多方协作才能作出周详的决定。最好的数据团队应该具有广泛的代表性。在项目中,应该包含来自客户组织、MSP、VMS和招聘合作公司的专业人士。我们需要这些主题专家来解决项目的“为什么”、“是什么”和“怎么做”。
“为什么”团队:招聘经理、运营主管和公司高管,他们提供商业技能。
“是什么”团队:招聘合作方、采购主管和人事专员,他们提供人力资源方面的技能。
“怎么做”团队:来自临时工企业、客户单位和技术提供商(比如VMS)的数据分析专家,他们知道如何收集信息,如何把信息转换成有意义的结论供决策者参考。
更为重要的是,确保数据团队体现多样化的想法和观点。很多企业认为自己是数据驱动型企业,重度依赖收集自多个信息源的信息,比如客户、员工、供应商等。但如果数据团队成员有太多的共同点(比如来自同一个部门),那么他们对数据的解读常常会带有偏见、过于简单、过于宽泛或者倾向于证明一个假设,而不是揭示一项事实。
再以工作应聘率为例。如果负责收集数据的人同时也是寻找或招聘求职者的人,那么他们最终会陷入防御心态。在这种情况下,他们往往会寻找数据来为他们的挫折辩护。或者,他们过度纠结于应该检查应聘者的哪些方面。而如果数据团队成员来自人力资源、营销、运营和招聘合作方等多种立场呢?引入临时工项目其他方面的利益相关者后,你会更加清楚地知道问题所在,找到解决办法。
找到恰当数据的“甜区”
韦塞尔在文章中写道:“恰当数据有时很大,有时很小。但对创新者来说,关键是弄明白哪些是能够提升竞争力的关键性数据。这些数据就是你应该积极探寻的恰当数据。”
关于项目(无论大小)的数据能把我们以前从来不知道的优秀人才和创新者呈现在我们眼前。我们只需要确保自己看向恰当的地方,翻开恰当的石头。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03