京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据为何有识才慧眼
前几年,美国麻省理工学院的几位人类行为动力学家将多个传感器组合成一个综合识别器。最初的样子就像一个灰色的盒子,里面装配着一个红外线收发器,一个麦克风和两个加速度传感器。有平装书大小,可以挂在胸前。这个综合传感器,可以将一个人讲话的最重要的信号,例如讲话的时间、当时的情绪、身体的各种反应记录下来,由此可以预测未来行动之趋势、发展之结果。
研究人员把这个“魔盒”带到了电视台“5分钟相亲”节目。参与节目的女性坐成一排,男性则每5分钟换一次位置,与之相互交谈、认识。根据双方交谈,“魔盒”能够预测他们二者是否合得来,能否继续交往下去,以后是否会进一步约会。男女双方交谈的过程,无疑会释放出不少社交信号的。但是,研究人员并不关注双方的言谈内容,而是让“魔盒”记录下双方非常微弱而又微妙的变化:包括声调的微弱变化,眉毛是否突然上扬,语速快慢以及有无插话等。这些都是人们无意识的动作,但是却暴露出了谈话双方的真实思想与情感。
通过反复实验,科学家发现,无须知道双方谈话内容,只凭这些获取的数据,就可以预测双方未来的情感发展结果。准确率达到85%。
现在,这种传感器已经做成了一个徽章大小,可以佩戴在身上。徽章充电一次,可以持续40个小时搜集数据。徽章内置了数据分析算法。佩戴者一年的数据都可以存储在内,通过这个徽章,员工可以了解自己和组织的互动关系,管理者可以了解员工的举止言行,对员工工作进行指导。
计算机到底捕捉了什么
让我们再来看这样一幅画面——
某人打开视频网站,正在观看一则广告,禁不住流露出惊喜的表情。这时,计算机的摄像头提示灯忽然闪了闪,这是什么意思?原来计算机是在做这样的事:对准那个人的眼睛定位,寻找嘴部水平中心线,xyz轴建模,测量他的眼轮匝肌、皱眉肌、颧大肌各块肌肉的位移,数据传回,数据库表情匹配。
通过这样的面部识别技术,是对这个人进行观察判断,准确率可达到96.9%。对于更为复杂的复合情绪识别率能达到76.9%。有家美国公司就专门为顾客提供情绪反应数据。此方法还可以用来进行表情测谎。原理是:人们进行虚假或真实的感情表达时,使用的大脑映射不同,反映在面部肌肉动作上也有不同。人类很难区分的细微感情变化,计算机却很容易。
从面部特征识别到表情识别,再在到情绪识别,计算机利用大数据能够辨别真实与谎言。
上海有位大学生利用商场试衣间,对准“试衣镜”映照出来的各式各样的顾客表情和体势,开发了一个软件,能够帮助老板预判顾客喜欢不喜欢这件正在试穿的商品,以利导购员对顾客讲一些怎样的话,他或她就会愿意购买这件商品。
人类千分之一秒的表情,倏忽而过。但是,计算机却能够迅即捕捉,做出判断,帮助人们决策。
还有伯乐的本事呢
看完上面的案例,你可能会认为基于大数据的识人本领,讲白了就是“以微知著”,拿“千分之一秒”做文章。其实,大数据还有别的本事呢。现在就再举一例。
大家都知道,我们每个用人单位都保存着员工的人事档案。目前,档案里记录的不过是员工的一些自然信息、能力信息、履历信息等,比较简单。如果我们建立一个大数据平台,就可以以这些信息为基础,进一步扩大搜集范围,例如将员工留在社交平台、浏览网站上的数据撷取过来,那就能立刻使他的相关信息丰富起来。
在四川成都,有一位年轻的大数据科学家,建立了基于大数据的“人才雷达”,能够从九个不同的维度,把一个人的相关数据撷取过来,使之丰富化、形象化、个体化。例如,你的“学术水准”,大概是从你的学术论文发表数量与被引用指数那里获取的;你的“社会活跃程度”,大概是从你出席国内外论坛次数那里获得的;你的“阅读领域”,大概是从你的购书记录与浏览网页那里获得的:你的“交往对象”,大概是从你的朋友圈那里获得的;你的“发展潜力”,大概是从你近五年发表论文的影响力那里获得的:你的“生活习惯”,大概是从你的手机、计算机开关时间那里获得的……这样,大数据就能够从四面八方为你或其他任何人画出一幅形象逼真的“素描图”。据报道,现在有的电商已经掌握了每个顾客的一万多个“标签”,就是一万多个特征标志。只要法律允许,画出一张你自己也不知道的“素描图”,应该不是难事。
人们只能长叹一声:“大数据已经炼就了火眼金睛!”
由此不难理解,哪个部门或组织若要寻访人才,依靠大数据,是一个相当不错的渠道。
中国人推崇“伯乐相马”。在今天这个大数据时代,除了有才爱才的个体伯乐和强调公平的制度伯乐外,还有了身手不凡的“大数据伯乐”。三种伯乐各有各的长处,三方结合在一起,必能收“放大增强”之效。
有志于引才的部门与单位,大家何乐而不为呢!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户 ...
2025-11-06在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30