京公网安备 11010802034615号
经营许可证编号:京B2-20210330
When looking at data scientist salaries and data science roles, it became obvious that there are different, more specific facets within data science. These facets relate to unique job positions, specifically, machine learning operations, NLP, data engineering, and data science itself. Of course, there are even more specific positions than these, but these can give you a general summary of what to expect if you land a job in one of these positions. I wanted to pick these four roles, too, because they can be separated well, almost as if it was there was a clustering algorithm that found jobs that were the most different between one another but that were also in the same population. Below, I will be discussing the average base pay with a low and high range, as well as respective seniority levels, the number of estimates used to determine these numbers, and expected skills and experiences for each role.
机器学习工程师倾向于将已经研究和构建的数据科学模型应用到生产环境中,通常包括软件工程和机器学习算法知识。话虽如此,你可以想象得到相当不错的薪水。这个特别的估计来自于GlassDoor[3]。
根据大约1900提交的工资,有以下广泛的范围:
正如你所看到的,这是一个范围,就像任何职位一样,你的经验越多,工资越高也就不足为奇了。除了多年的经验,你工作的州,你雇用的技能,公司也会努力创造最终的工资数额--所有这些职位都是如此。为了获得更多的粒度,我们可以查看不同的资历级别,以便了解级别的增加与工资数额的关系:
以下是一些来自个人经验的技能,您可以期望在机器学习职位上使用:
通常被称为NLP工程师,这个角色通常专注于将数据科学模型或机器学习算法应用于文本数据。NLP工作的一些例子是主题建模、大量文本、语义分析和chatbot代理。话虽如此,你也可以想象出相当不错的工资--然而,这个工资细目将低于机器学习工程师,很可能是因为这个角色不太包容,更专注于数据科学中的特定主题。这个特别的估计也来自于Glassdoor[5]。
根据大约20提交的工资,有以下广泛的范围:
值得注意的是,报告的工资数额相当低,所以对这个范围持怀疑态度,但尽管如此,对这个工资仍然有很高的信心。
所有这些数量都低于机器学习,然而,与大多数其他角色相比,它们仍然相当高。
以下是一些来自个人经验的技能,你可以期望在自然语言处理工程师的职位上使用:
也许一个更常见的角色是数据工程,它与数据科学比在数据科学之下更相关。然而,这个角色对数据科学工作来说仍然至关重要,有时,数据科学家可以期望知道数据工程师所知道的大部分内容,所以我将在本文分析中包括它。数据工程的一些示例包括创建存储最终用于数据科学模型的数据的ETL作业,以及自动存储模型结果和执行查询优化。这个特别的估计也来自于Glassdoor[7]。
根据大约~6,800提交的工资,有以下广泛的范围:
这个范围更类似于自然语言处理工程师的角色,然而,它可能与日常工作中的实际工作角色相距最远。同样重要的是要注意,这个职位涉及到相当多的估计。
以下是一些来自个人经验的技能,您可以期望在数据工程师职位上使用:
最后,但并非最不重要的,是数据科学家的角色。虽然这个角色看起来是最一般的,但实际上也可以是具体的,通常主要由模型构建过程组成--有时需要数据工程和机器学习工程师操作,但可能性较小--但仍然可能涉及自然语言处理方面的专业(通常如果重点是NLP,那么数据科学家将以此为标题--但不是一直)。这个角色还可以有更多的可变性,所以我们也可以期待一个广泛的范围。这个特别的估计也来自于Glassdoor[9]。
根据大约~16,200提交的工资,有以下广泛的范围:
出人意料地低于预期,这一角色在本分析中的大多数其他角色附近。话虽如此,它可能是对离群值最真实和稳健的,因为它是迄今为止提交来组成这些工资数额的最多的工资数额。
以下是一些来自个人经验的技能,您可以期望在数据科学职位上使用:
While these roles can have several similarities and differences, the same can be said about their salary ranges. Nearly three of the four salaries were similar, with one standing out. That role was machine learning engineer —why is that?My understanding is that this role requires a knowledge of most data science concepts, and especially their output, as well the software engineering involved around deployment — that is a lot to know and employ, so it makes sense why a role that composes both software engineering and data science pays so well. In addition to the salary breakdown of each data science role — or similar to data science in some way, were the skills that you can expect to employ, so that you can have a better idea of the role and how that relates to the salary amount.
总结一下,以下是我们分析的四个职位,以及你可以期望使用的技能:
我希望你觉得我的文章既有趣又有用。如果你同意这些数字和范围,请随时在下面发表评论--为什么或为什么不?你认为有一个角色,尤其是,离现实如此之远吗?你还能想到哪些数据科学角色会有不同的工资细分吗?一个角色的其他因素会影响薪水吗?
这些薪金是在美国报告的,因此它们是以美元数额计算的。我与这些公司中的任何一家都没有关联。
请随时查看我的个人资料和其他文章,并在LinkedIn上联系我。
[1] Photo byThought CatalogonUnsplash, (2018)
[2]Photo Byassed PhotographyonUnsplash,(2018)
[3]Glassdoor,Inc.,机器学习工程师工资,(2008-2021)
[4]Photo Bybatrick TomassoonUnsplash,(2016)
[5]Glassdoor,Inc.自然语言处理工程师工资,(2008-2021)
[6]Caspar Camille RubinonUnsplash的照片,(2017)
[7]Glassdoor,Inc.,数据工程师工资,(2008-2021)
[8]照片byDaria NepriakhinaonUnsplash,(2017)
[9]Glassdoor,Inc.,数据科学家工资,(2008-2021)
Bio: Matthew Przybyla is Senior 数据科学家 at Favor Delivery, and a freelance technical writer, especially in data science.
原创。经允许转发。
相关:
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10