京公网安备 11010802034615号
经营许可证编号:京B2-20210330
When looking at data scientist salaries and data science roles, it became obvious that there are different, more specific facets within data science. These facets relate to unique job positions, specifically, machine learning operations, NLP, data engineering, and data science itself. Of course, there are even more specific positions than these, but these can give you a general summary of what to expect if you land a job in one of these positions. I wanted to pick these four roles, too, because they can be separated well, almost as if it was there was a clustering algorithm that found jobs that were the most different between one another but that were also in the same population. Below, I will be discussing the average base pay with a low and high range, as well as respective seniority levels, the number of estimates used to determine these numbers, and expected skills and experiences for each role.
机器学习工程师倾向于将已经研究和构建的数据科学模型应用到生产环境中,通常包括软件工程和机器学习算法知识。话虽如此,你可以想象得到相当不错的薪水。这个特别的估计来自于GlassDoor[3]。
根据大约1900提交的工资,有以下广泛的范围:
正如你所看到的,这是一个范围,就像任何职位一样,你的经验越多,工资越高也就不足为奇了。除了多年的经验,你工作的州,你雇用的技能,公司也会努力创造最终的工资数额--所有这些职位都是如此。为了获得更多的粒度,我们可以查看不同的资历级别,以便了解级别的增加与工资数额的关系:
以下是一些来自个人经验的技能,您可以期望在机器学习职位上使用:
通常被称为NLP工程师,这个角色通常专注于将数据科学模型或机器学习算法应用于文本数据。NLP工作的一些例子是主题建模、大量文本、语义分析和chatbot代理。话虽如此,你也可以想象出相当不错的工资--然而,这个工资细目将低于机器学习工程师,很可能是因为这个角色不太包容,更专注于数据科学中的特定主题。这个特别的估计也来自于Glassdoor[5]。
根据大约20提交的工资,有以下广泛的范围:
值得注意的是,报告的工资数额相当低,所以对这个范围持怀疑态度,但尽管如此,对这个工资仍然有很高的信心。
所有这些数量都低于机器学习,然而,与大多数其他角色相比,它们仍然相当高。
以下是一些来自个人经验的技能,你可以期望在自然语言处理工程师的职位上使用:
也许一个更常见的角色是数据工程,它与数据科学比在数据科学之下更相关。然而,这个角色对数据科学工作来说仍然至关重要,有时,数据科学家可以期望知道数据工程师所知道的大部分内容,所以我将在本文分析中包括它。数据工程的一些示例包括创建存储最终用于数据科学模型的数据的ETL作业,以及自动存储模型结果和执行查询优化。这个特别的估计也来自于Glassdoor[7]。
根据大约~6,800提交的工资,有以下广泛的范围:
这个范围更类似于自然语言处理工程师的角色,然而,它可能与日常工作中的实际工作角色相距最远。同样重要的是要注意,这个职位涉及到相当多的估计。
以下是一些来自个人经验的技能,您可以期望在数据工程师职位上使用:
最后,但并非最不重要的,是数据科学家的角色。虽然这个角色看起来是最一般的,但实际上也可以是具体的,通常主要由模型构建过程组成--有时需要数据工程和机器学习工程师操作,但可能性较小--但仍然可能涉及自然语言处理方面的专业(通常如果重点是NLP,那么数据科学家将以此为标题--但不是一直)。这个角色还可以有更多的可变性,所以我们也可以期待一个广泛的范围。这个特别的估计也来自于Glassdoor[9]。
根据大约~16,200提交的工资,有以下广泛的范围:
出人意料地低于预期,这一角色在本分析中的大多数其他角色附近。话虽如此,它可能是对离群值最真实和稳健的,因为它是迄今为止提交来组成这些工资数额的最多的工资数额。
以下是一些来自个人经验的技能,您可以期望在数据科学职位上使用:
While these roles can have several similarities and differences, the same can be said about their salary ranges. Nearly three of the four salaries were similar, with one standing out. That role was machine learning engineer —why is that?My understanding is that this role requires a knowledge of most data science concepts, and especially their output, as well the software engineering involved around deployment — that is a lot to know and employ, so it makes sense why a role that composes both software engineering and data science pays so well. In addition to the salary breakdown of each data science role — or similar to data science in some way, were the skills that you can expect to employ, so that you can have a better idea of the role and how that relates to the salary amount.
总结一下,以下是我们分析的四个职位,以及你可以期望使用的技能:
我希望你觉得我的文章既有趣又有用。如果你同意这些数字和范围,请随时在下面发表评论--为什么或为什么不?你认为有一个角色,尤其是,离现实如此之远吗?你还能想到哪些数据科学角色会有不同的工资细分吗?一个角色的其他因素会影响薪水吗?
这些薪金是在美国报告的,因此它们是以美元数额计算的。我与这些公司中的任何一家都没有关联。
请随时查看我的个人资料和其他文章,并在LinkedIn上联系我。
[1] Photo byThought CatalogonUnsplash, (2018)
[2]Photo Byassed PhotographyonUnsplash,(2018)
[3]Glassdoor,Inc.,机器学习工程师工资,(2008-2021)
[4]Photo Bybatrick TomassoonUnsplash,(2016)
[5]Glassdoor,Inc.自然语言处理工程师工资,(2008-2021)
[6]Caspar Camille RubinonUnsplash的照片,(2017)
[7]Glassdoor,Inc.,数据工程师工资,(2008-2021)
[8]照片byDaria NepriakhinaonUnsplash,(2017)
[9]Glassdoor,Inc.,数据科学家工资,(2008-2021)
Bio: Matthew Przybyla is Senior 数据科学家 at Favor Delivery, and a freelance technical writer, especially in data science.
原创。经允许转发。
相关:
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12