京公网安备 11010802034615号
经营许可证编号:京B2-20210330
When looking at data scientist salaries and data science roles, it became obvious that there are different, more specific facets within data science. These facets relate to unique job positions, specifically, machine learning operations, NLP, data engineering, and data science itself. Of course, there are even more specific positions than these, but these can give you a general summary of what to expect if you land a job in one of these positions. I wanted to pick these four roles, too, because they can be separated well, almost as if it was there was a clustering algorithm that found jobs that were the most different between one another but that were also in the same population. Below, I will be discussing the average base pay with a low and high range, as well as respective seniority levels, the number of estimates used to determine these numbers, and expected skills and experiences for each role.
机器学习工程师倾向于将已经研究和构建的数据科学模型应用到生产环境中,通常包括软件工程和机器学习算法知识。话虽如此,你可以想象得到相当不错的薪水。这个特别的估计来自于GlassDoor[3]。
根据大约1900提交的工资,有以下广泛的范围:
正如你所看到的,这是一个范围,就像任何职位一样,你的经验越多,工资越高也就不足为奇了。除了多年的经验,你工作的州,你雇用的技能,公司也会努力创造最终的工资数额--所有这些职位都是如此。为了获得更多的粒度,我们可以查看不同的资历级别,以便了解级别的增加与工资数额的关系:
以下是一些来自个人经验的技能,您可以期望在机器学习职位上使用:
通常被称为NLP工程师,这个角色通常专注于将数据科学模型或机器学习算法应用于文本数据。NLP工作的一些例子是主题建模、大量文本、语义分析和chatbot代理。话虽如此,你也可以想象出相当不错的工资--然而,这个工资细目将低于机器学习工程师,很可能是因为这个角色不太包容,更专注于数据科学中的特定主题。这个特别的估计也来自于Glassdoor[5]。
根据大约20提交的工资,有以下广泛的范围:
值得注意的是,报告的工资数额相当低,所以对这个范围持怀疑态度,但尽管如此,对这个工资仍然有很高的信心。
所有这些数量都低于机器学习,然而,与大多数其他角色相比,它们仍然相当高。
以下是一些来自个人经验的技能,你可以期望在自然语言处理工程师的职位上使用:
也许一个更常见的角色是数据工程,它与数据科学比在数据科学之下更相关。然而,这个角色对数据科学工作来说仍然至关重要,有时,数据科学家可以期望知道数据工程师所知道的大部分内容,所以我将在本文分析中包括它。数据工程的一些示例包括创建存储最终用于数据科学模型的数据的ETL作业,以及自动存储模型结果和执行查询优化。这个特别的估计也来自于Glassdoor[7]。
根据大约~6,800提交的工资,有以下广泛的范围:
这个范围更类似于自然语言处理工程师的角色,然而,它可能与日常工作中的实际工作角色相距最远。同样重要的是要注意,这个职位涉及到相当多的估计。
以下是一些来自个人经验的技能,您可以期望在数据工程师职位上使用:
最后,但并非最不重要的,是数据科学家的角色。虽然这个角色看起来是最一般的,但实际上也可以是具体的,通常主要由模型构建过程组成--有时需要数据工程和机器学习工程师操作,但可能性较小--但仍然可能涉及自然语言处理方面的专业(通常如果重点是NLP,那么数据科学家将以此为标题--但不是一直)。这个角色还可以有更多的可变性,所以我们也可以期待一个广泛的范围。这个特别的估计也来自于Glassdoor[9]。
根据大约~16,200提交的工资,有以下广泛的范围:
出人意料地低于预期,这一角色在本分析中的大多数其他角色附近。话虽如此,它可能是对离群值最真实和稳健的,因为它是迄今为止提交来组成这些工资数额的最多的工资数额。
以下是一些来自个人经验的技能,您可以期望在数据科学职位上使用:
While these roles can have several similarities and differences, the same can be said about their salary ranges. Nearly three of the four salaries were similar, with one standing out. That role was machine learning engineer —why is that?My understanding is that this role requires a knowledge of most data science concepts, and especially their output, as well the software engineering involved around deployment — that is a lot to know and employ, so it makes sense why a role that composes both software engineering and data science pays so well. In addition to the salary breakdown of each data science role — or similar to data science in some way, were the skills that you can expect to employ, so that you can have a better idea of the role and how that relates to the salary amount.
总结一下,以下是我们分析的四个职位,以及你可以期望使用的技能:
我希望你觉得我的文章既有趣又有用。如果你同意这些数字和范围,请随时在下面发表评论--为什么或为什么不?你认为有一个角色,尤其是,离现实如此之远吗?你还能想到哪些数据科学角色会有不同的工资细分吗?一个角色的其他因素会影响薪水吗?
这些薪金是在美国报告的,因此它们是以美元数额计算的。我与这些公司中的任何一家都没有关联。
请随时查看我的个人资料和其他文章,并在LinkedIn上联系我。
[1] Photo byThought CatalogonUnsplash, (2018)
[2]Photo Byassed PhotographyonUnsplash,(2018)
[3]Glassdoor,Inc.,机器学习工程师工资,(2008-2021)
[4]Photo Bybatrick TomassoonUnsplash,(2016)
[5]Glassdoor,Inc.自然语言处理工程师工资,(2008-2021)
[6]Caspar Camille RubinonUnsplash的照片,(2017)
[7]Glassdoor,Inc.,数据工程师工资,(2008-2021)
[8]照片byDaria NepriakhinaonUnsplash,(2017)
[9]Glassdoor,Inc.,数据科学家工资,(2008-2021)
Bio: Matthew Przybyla is Senior 数据科学家 at Favor Delivery, and a freelance technical writer, especially in data science.
原创。经允许转发。
相关:
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析实战中,我们经常会遇到“多指标冗余”的问题——比如分析企业经营状况时,需同时关注营收、利润、负债率、周转率等十 ...
2026-02-04在数据分析场景中,基准比是衡量指标表现、评估业务成效、对比个体/群体差异的核心工具,广泛应用于绩效评估、业务监控、竞品对 ...
2026-02-04业务数据分析是企业日常运营的核心支撑,其核心价值在于将零散的业务数据转化为可落地的业务洞察,破解运营痛点、优化业务流程、 ...
2026-02-04在信贷业务中,违约率是衡量信贷资产质量、把控信用风险、制定风控策略的核心指标,其统计分布特征直接决定了风险定价的合理性、 ...
2026-02-03在数字化业务迭代中,AB测试已成为验证产品优化、策略调整、运营活动效果的核心工具。但多数业务场景中,单纯的“AB组差异对比” ...
2026-02-03企业战略决策的科学性,决定了其长远发展的格局与竞争力。战略分析方法作为一套系统化、专业化的思维工具,为企业研判行业趋势、 ...
2026-02-03在统计调查与数据分析中,抽样方法分为简单随机抽样与复杂抽样两大类。简单随机抽样因样本均匀、计算简便,是基础的抽样方式,但 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27