
我最近读到一篇文章,将数据科学描述为一个过饱和的领域。文章预测ML工程师将在未来几年取代数据科学家。
根据这篇文章的作者,大多数公司致力于用数据科学解决非常相似的业务问题。因此,数据科学家没有必要提出解决问题的新方法。
作者接着说,在大多数数据驱动的组织中,为了解决问题,只需要基本的数据科学技能。这个角色很容易被机器学习工程师取代--一个拥有数据科学算法基础知识的人,他也拥有部署ML模型的知识。
在过去的一年里,我读过许多类似的文章。
其中一些人表示,数据科学家的角色将被AutoML之类的工具所取代,而另一些人则将数据科学称为“垂死的领域”,很快将被数据工程和ML操作之类的角色所超越。
作为一个与数据行业不同支柱密切合作的人,我想就这个主题提供我的观点,并回答以下问题:
大多数组织中的数据科学工作流程非常相似。许多公司雇佣数据科学家来解决类似的商业问题。大多数建立的模型都不需要你想出新颖的解决方案。
在这些组织中,您将采用的解决数据驱动问题的大多数方法很可能以前已经使用过,您可以从网上可用的大量资源中获得灵感。
此外,AutoML和DataRobot等自动化工具的兴起使预测建模变得更加容易。
我在一些业务用例中使用DataRobot,它是一个很好的工具。它迭代许多值,并为您的模型选择最佳参数,以确保最终得到尽可能高精度的模型。
因此,如果预测模型随着时间的推移变得更加容易,为什么公司仍然需要数据科学家?为什么他们不直接使用自动化工具和ML工程师的组合来管理他们的整个数据科学工作流呢?
答案很简单:
首先,数据科学从来不是关于重新发明轮子或构建高度复杂的算法。
数据科学家的角色是用数据为组织增加价值。在大多数公司中,只有很小一部分涉及到构建ML算法。
其次,总会有自动化工具无法解决的问题。这些工具有一组固定的算法,您可以从中选择,如果您确实发现了一个需要结合使用多种方法来解决的问题,您将需要手动完成。
虽然这种情况并不经常发生,但仍然会发生--作为一个组织,你需要雇佣足够熟练的人来做到这一点。此外,像DataRobot这样的工具不能进行数据预处理,也不能进行建模之前的任何繁重工作。
作为一个为初创企业和大公司创建数据驱动解决方案的人,这种情况与处理Kaggle数据集的情况非常不同。
没有固定的问题。通常,您有一个数据集,然后给您一个业务问题。如何利用客户数据来最大限度地提高公司的销售额取决于您。
这意味着数据科学家需要的不仅仅是技术或建模技能。您将需要将数据与手头的问题连接起来。您需要决定可以优化解决方案的外部数据源。
数据预处理是漫长而艰苦的,不仅因为它需要很强的编程技能,还因为您需要试验不同的变量及其与手头问题的相关性。
您需要将模型精确度与转换率之类的指标联系起来。
模型构建并不总是这个过程的一部分。有时,一个简单的计算可能足以执行像客户排名这样的任务。只有一些问题需要你做出预测。
归根结底,数据科学家为组织提供的价值在于他们将数据应用于现实世界用例的能力。无论是建立细分模型、推荐系统,还是评估客户潜力,除非结果是可解释的,否则对组织没有真正的好处。
只要一个数据科学家能够在数据的帮助下解决问题,并弥合技术和业务技能之间的差距,这个角色就会继续存在。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-07-22解析神经网络中 Softmax 函数的核心作用 在神经网络的发展历程中,激活函数扮演着至关重要的角色,它们为网络赋予了非线性能力, ...
2025-07-22CDA数据分析师证书考取全攻略 一、了解 CDA 数据分析师认证 CDA 数据分析师认证是一套科学化、专业化、国际化的人才考核标准, ...
2025-07-22左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-22你是不是也经常刷到别人涨粉百万、带货千万,心里痒痒的,想着“我也试试”,结果三个月过去,粉丝不到1000,播放量惨不忍睹? ...
2025-07-21我是陈辉,一个创业十多年的企业主,前半段人生和“文字”紧紧绑在一起。从广告公司文案到品牌策划,再到自己开策划机构,我靠 ...
2025-07-21CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-21MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-21在AI渗透率超85%的2025年,企业生存之战就是数据之战,CDA认证已成为决定企业存续的生死线!据麦肯锡全球研究院数据显示,AI驱 ...
2025-07-2035岁焦虑像一把高悬的利刃,裁员潮、晋升无望、技能过时……当职场中年危机与数字化浪潮正面交锋,你是否发现: 简历投了10 ...
2025-07-20CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-18刚入职场或是在职场正面临岗位替代、技能更新、人机协作等焦虑的打工人,想要找到一条破解职场焦虑和升职瓶颈的系统化学习提升 ...
2025-07-182025被称为“AI元年”,而AI,与数据密不可分。网易公司创始人丁磊在《AI思维:从数据中创造价值的炼金术 ...
2025-07-18CDA 数据分析师:数据时代的价值挖掘者 在大数据席卷全球的今天,数据已成为企业核心竞争力的重要组成部分。从海量数据中提取有 ...
2025-07-18SPSS 赋值后数据不显示?原因排查与解决指南 在 SPSS( Statistical Package for the Social Sciences)数据分析过程中,变量 ...
2025-07-18在 DBeaver 中利用 MySQL 实现表数据同步操作指南 在数据库管理工作中,将一张表的数据同步到另一张表是常见需求,这有助于 ...
2025-07-18数据分析师的技能图谱:从数据到价值的桥梁 在数据驱动决策的时代,数据分析师如同 “数据翻译官”,将冰冷的数字转化为清晰的 ...
2025-07-17Pandas 写入指定行数据:数据精细化管理的核心技能 在数据处理的日常工作中,我们常常需要面对这样的场景:在庞大的数据集里精 ...
2025-07-17解码 CDA:数据时代的通行证 在数字化浪潮席卷全球的今天,当企业决策者盯着屏幕上跳动的数据曲线寻找增长密码,当科研人员在 ...
2025-07-17CDA 精益业务数据分析:数据驱动业务增长的实战方法论 在企业数字化转型的浪潮中,“数据分析” 已从 “加分项” 成为 “必修课 ...
2025-07-16