京公网安备 11010802034615号
经营许可证编号:京B2-20210330
认为你的公司需要数据科学家?你可能错了
当我在15年前开始从事数据工作时,我从未想过近年来数据科学家会如此备受追捧。如今,数据科学家被认为是全球最热门的职位之一,市场上对数据科学家的需求供不应求。
创业公司在产品生命周期的早期招聘数据科学家的情况并不罕见。其实很多情况下,他们并不需要数据科学家。
作为一名数据科学方面的倡导者,为什么我会这么认为呢?
首先,我想声明的是雇用数据科学家确实有很多好处。如果使用得当,数据科学家将成为强大的商业武器。我想强调的是,数据科学当中涉及到大量的数据相关操作和技巧,这不是在短期培训中就能掌握的。
因此,当企业需要聘请数据科学家时,需要慎重考虑应该何时聘请哪种数据科学家。
当企业打算聘请数据科学家之前,可以先试着问自己以下四个问题:
1. 有多少数据?
如果你是一家尚未启动的创业公司,那么你们可能并不需要全职数据科学家。其实,如果你的公司已经发展的较为成熟,但只有小规模的客户、产品或会员基础,那么你也不需要数据科学家。
为什么呢?显然数据科学家需要数据。不是任何数据都可以。许多技术需要至少数万个、甚至数百万个数据点才能构建。
如今,深度学习备受关注。在针对数据科学家的工作描述中充满了神经网络、计算机视觉和自然语言处理等术语。而这类技术依赖于大量的训练数据。谷歌翻译就是建立在超过1.5亿个词汇基础上的神经网络。成功部署这型模型所需的数据量超过了许多公司加起来的数据总量。
很多技术比深度学习使用更少的数据,但是当中仍然需要相当大的样本,还需要能够判断何时使用哪种方法的知识储备。目前需要大量的投入才能创建数据科学所需要的环境,拥有资金和昂贵的资源是远远不够的。
2. 是否有已制定的关键绩效指标(KPI)和商业智能报表?
如果没有对企业驱动因素的基本了解,那么将难以利用先进技术。
数据科学家能够通过机器学习进行预测,例如哪些用户会流失、哪些用户很活跃。但是如果缺乏对流失和高度活跃的定义,那么在构建预测模型之前会遇到问题。
此外,如果没有足够的指标进行评估,那么将很难验证模型。A/B测试等其他技术需要总体评估标准(OEC),这通常是业务驱动的KPI。
3. 数据科学家要做什么?
这是四个问题中最主观和最有趣的问题,“你想让数据科学家做什么?”我得到的最常见的答案是:“我们不知道,这也是为什么我们需要雇用一位。”
在这种情况下,我会告诉该企业这是行不通的。虽然聘请数据科学家时,你并不需要成为该方面的专家,但是你应该清楚哪些是可行的、哪些是不可行的,从而不会设定不切实际的期望。
数据科学不是魔术,但也不是传统科学。数据科学是一门艺术,也是一门科学,这意味着当中技术和能力的可变性很大。企业可以考虑让现有团队的成员发展成数据科学家。对现有分析师来说,进入数据科学领域的方式之一是对现有的KPI进行预测。一方面,他们有机会学习熟悉的数据; 另一方面,对现有员工进行投资意味着将来市场招聘的需求减少。
4. 数据科学家有哪些内部支持?
如果数据科学家在你的企业没有适当的支持,那么请不要为招募他们而投资。近年来,数据科学课程数量激增,然而许多毕业生并没有准备好解决业务问题。绝大多数课程都让学生解决预先清洁好的数据。在现实世界中,干净的数据并不存在。
在没有高级数据科学家指导的前提下,聘请初级数据科学家并不明智,初级数据科学家会遇到难题,而且往往会导致错误的分析。初级的数据科学家团队难以将业务问题转化为技术问题,而错误的分析会导致任务难以完成。
聘请高级数据科学家并不能完全缓解这个问题,部分原因在于很难证明雇佣人员的水平和资历。如果你很幸运地聘请到优秀的人员,他仍然需要来自领导团队的大量支持。比如,创建从未使用过的模型;或者进行A/B测试但结果被忽略。更糟的是,分析问题所需的数据并没有被收集。
通常,必要的第一步是强大的数据收集程序,这需要由工程师或数据库管理员提供,而不是数据科学家。在很多企业中,高级数据科学家需要花大量时间完成数据需求和团队部署,而这很容易导致高级数据科学家的流失。
结语
招聘和留住优秀的数据科学家的成本是很昂贵的。但如果能明确何时聘用、如何聘用、聘用哪种人才,则能够有效地减少成本。
不要陷入招聘广告的陷阱,那些只是对工作技能的简单罗列。不要奢望数据科学家会魔法。一定要明确自身的真实需求,如果可能的话,在进行招聘之前咨询专业人员。企业数据方面的成功取决于以上这几点。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户 ...
2025-11-06在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31