
如何用贝叶斯算法甄选优质PD和程序员?
今天中午和同事聚餐的时候讨论一个有趣的话题:我们经常用朴素贝叶斯来过滤垃圾邮件,可以用朴素贝叶斯算法来挑选靠谱的小伙伴、过滤掉不靠谱的求职者吗?
正方观点招聘的时候我们一直在使用贝叶斯。挑选100个优秀的员工,100个表现差的员工,对他们的个性进行分词(tokenization),然后统计各种特性在两个群体中的词频,和概率。(样本训练)
对求职者的个性、技能进行分词,然后根据朴素贝叶斯算法计算出这个人是优秀人才的概率。(计算后验概率)
反方观点履历好、高学历可能是人渣,辍学生也有可能是优质人才。我们不该带着有色眼镜去看待别人。
酒足饭饱后,大家的话题也转移到妹子、过年回家的计划等等,就不再继续讨论了。
我却觉得很有趣,故写下此文。
在招聘新人时,哪些特性(token、tag、filter)是敏感度高、特异度高的过滤器呢?
以下是我整理的「特性」列表,如果你恰好符合,说明咱俩是一丘之貉;如果你不符合,也无大碍,咱俩求同存异。
三观 过滤器
和 | 不和 |
---|---|
反星座 | 吃饭必谈星座 |
反中医 | 爱中医、爱国粹 |
和:谈得拢
不和:话不投机
对待中医
一个没有学习过现代医学、医学统计学、药理学,很难对中医有理性思考。尤其是文科生,对中医文化情有独钟。
1
|
<span class="pun">若不从事医学行业,对中医的无知都是可以原谅的。大不了只坑害自己,不会坑害别人。</span>
|
星座关于星座,没什么好说的。判断力正常又迷恋星座的有两类人:
1
2
|
<span class="pun">*</span> <span class="pun">销售人员:</span> <span class="pun">通过谈论星座套你生日,随手把你录入自己的</span><span class="pln"> CRM </span><span class="pun">系统,定期给你送生日礼物,维护客户关系。</span>
<span class="pun">*</span> <span class="pun">「女性产品」的产品经理,比如大姨妈,西柚,薄荷。</span>
|
产品经理的过滤器
1. 书单
和 | 不和 |
---|---|
设计心理学 | 不读书 |
Rework |
|
Dont’t make me think |
|
黑客与画家 |
|
精益创业 |
|
如果一个产品经理工作一年,这几本书都没读过,就可以过滤掉了。
2. 手机
和 | 不和 |
---|---|
多部手机,覆盖 Android/iOS/Windows |
|
安装了很多App (>100) |
|
各种平板设备 |
|
对互联网有感觉的产品经理会尝试各种新奇的、好玩的、有趣的事情,他的手机里会不自觉的安装各种App。
所以,一个产品经理的手机里若只有寥寥几个App,我觉得也可以过滤掉。
3. 口头禅
和 | 不和 |
---|---|
用户反馈、文案、细分、DAU、PV、UV、转化率、A/B test 、打开率、EDM | 战略、布局、市场、模式、平台、虎嗅、小米模式、O2O |
根据口头禅也可以过滤产品经理?
听上去很扯,其实我是有理由的。
有一次李宁面试人人网出来的一个产品经理,聊了20分钟,此人满嘴都是战略,听上去一副怀才不遇,即将大展拳脚的样子。深入细问:你打算怎么做呢?对方顿时语塞。
经常见一些产品经理整天探讨小米模式、苹果成功的秘密、互联网的未来、《三体》揭露的互联网未来的启示录,热衷于预测趋势,分析战略。却写不好文案、不会看数据、不会分析数据、不回复客服反馈,不会用户访谈,我招你有什么用呢?
相反,我认识的几个优秀的的产品经理既都是非常务实的,** 他们的口头禅都是「可执行的」。**
二爷:Google Analytic 用到了极致,从来都是用数据说话,不凭感觉。他的口头禅是 细分 / UV / PV。
李宁:喜欢回复用户反馈,根据反馈迭代。他的口头禅是 整理数据 / 原型图 / 用户反馈 / 会议记录。
李作刚的口头禅是 文案 / 用户心理 / EDM 。
张进:丁香园CEO,曾经的产品总监,执行力很强的一个人。口头禅是 Due date / 论坛用户反馈。
冯大辉的口头禅是 错别字 / 圆角 / 字体 / 像素 / 响应式 / 流量。
相反,整天满嘴跑火车,把战略和模式挂在嘴边的都是不靠谱的「互联网分析大师」。
4. 工作习惯
和 | 不和 |
---|---|
Fuck meeting | Love meeting |
Work async(发邮件,写文档) | Love IM chatting |
Chase user | Chase boss/vc |
Utilize calendar and tasks to the max. |
|
GTD(或其他时间管理方式) |
|
用工作习惯这个过滤器可以筛掉工作效率低的产品经理。
日历、邮件、GTD重度用户一般都是时间管理高手
不愿整天扯犊子的一般都是沟通高手
喜欢写邮件的都喜欢一次性陈述完毕,do it once. 喜欢IM 工具的产品经理一般啰哩啰嗦,需要反复沟通。
5. 工具
和 | 不和 |
---|---|
Axure / Omni Graffle |
|
Evernote/为知/有道笔记 |
|
友盟 |
|
Google Analytic |
|
Things/Omni Focus/ Do.it |
|
Gmail |
|
Markdown |
|
以上是我总结的产品经理过滤器的五个大方面。
三 程序员过滤器
对待技术小伙伴,我的个人好恶只有一条:
和 | 不和 |
---|---|
love coding | coding is just a job.(养家糊口型) |
在 Github 上有(或参与)开源项目。如果满足此项,说明此人已经熟悉 Git,熟悉 Github work flow。
Vim党。打磨农具很花时间,优秀的程序员不一定喜欢打磨农具,但痴迷于 Vim 这个农具的的程序员一般都比较优秀。(丁香园的明城、薄荷的zgm 都是样本)
开发环境在 Linux/Mac。
Blogger,热爱分享技术。
会翻墙
有 Side Project。说明他热爱 codiing
2. 养家糊口型程序员的过滤器
我用来筛选此类程序员的一个特别敏感的过滤器:业余时间的分配。
他们在闲暇的时间一般不看技术书籍、不看技术博客、不优化代码。
结束语
题图是贝叶斯,一个牧师,业余数学家,创建了一个数学流派。贝叶斯算法是其代表作品。
本文的讨论总结下来就是在计算两个先验概率:
如果优秀的产品经理(程序员)都有A这项特质,那么一个含有A这项特质的人,有多大的概率是个优秀的产品经理(程序员)?
如果 Garbage PD (programmer) 都有B这项特质,那么一个含有B 特质的人,有多大概率是个 Garbage PD(programmer)?
你在面试别人时有没有灵敏度高、特意度高的过滤器?你如何预见求职者一年后的样子?
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
前台流量与后台流量:数据链路中的双重镜像 在商业数据分析体系中,流量数据是洞察用户行为与系统效能的核心依据。前台流量与 ...
2025-08-13商业数据分析体系构建与 CDA 数据分析师的协同赋能 在企业数字化转型的浪潮中,商业数据分析已从 “可选工具” 升级为 “核 ...
2025-08-13解析 CDA 数据分析师:数据时代的价值挖掘者 在数字经济高速发展的今天,数据已成为企业核心资产,而将数据转化为商业价值的 ...
2025-08-13解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-08-12MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-12PyTorch 中 Shuffle 机制:数据打乱的艺术与实践 在深度学习模型训练过程中,数据的呈现顺序往往对模型性能有着微妙却关键的影响 ...
2025-08-12Pandas 多列条件筛选:从基础语法到实战应用 在数据分析工作中,基于多列条件筛选数据是高频需求。无论是提取满足特定业务规则的 ...
2025-08-12人工智能重塑 CDA 数据分析领域:从工具革新到能力重构 在数字经济浪潮与人工智能技术共振的 2025 年,数据分析行业正经历着前所 ...
2025-08-12游戏流水衰退率:计算方法与实践意义 在游戏行业中,流水(即游戏收入)是衡量一款游戏商业表现的核心指标之一。而游戏流水衰退 ...
2025-08-12CDA 一级:数据分析入门的基石 在当今数据驱动的时代,数据分析能力已成为职场中的一项重要技能。CDA(Certified Data Anal ...
2025-08-12破解游戏用户流失困局:从数据洞察到留存策略 在游戏行业竞争白热化的当下,用户流失率已成为衡量产品健康度的核心指标。一款游 ...
2025-08-11数据时代的黄金入场券:CDA 认证解锁职业新蓝海 一、万亿级市场需求下的数据分析人才缺口 在数字化转型浪潮中,数据已成为企业核 ...
2025-08-11DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08CDA 数据分析师:解锁数据价值的专业力量 在当今这个数据爆炸的时代,数据已成为像石油一样珍贵的战略资源。而 CDA 数据分析师, ...
2025-08-08SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-08-07SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-08-07CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-07大数据时代对定性分析的影响 在大数据时代,海量、多样、高速且低价值密度的数据充斥着我们的生活与工作。而定性分析作为一 ...
2025-08-07K-S 曲线、回归与分类:数据分析中的重要工具 在数据分析与机器学习领域,K-S 曲线、回归和分类是三个核心概念与工具,它们各 ...
2025-08-07