京公网安备 11010802034615号
经营许可证编号:京B2-20210330
When looking at data scientist salaries and data science roles, it became obvious that there are different, more specific facets within data science. These facets relate to unique job positions, specifically, machine learning operations, NLP, data engineering, and data science itself. Of course, there are even more specific positions than these, but these can give you a general summary of what to expect if you land a job in one of these positions. I wanted to pick these four roles, too, because they can be separated well, almost as if it was there was a clustering algorithm that found jobs that were the most different between one another but that were also in the same population. Below, I will be discussing the average base pay with a low and high range, as well as respective seniority levels, the number of estimates used to determine these numbers, and expected skills and experiences for each role.
机器学习工程师倾向于将已经研究和构建的数据科学模型应用到生产环境中,通常包括软件工程和机器学习算法知识。话虽如此,你可以想象得到相当不错的薪水。这个特别的估计来自于GlassDoor[3]。
根据大约1900提交的工资,有以下广泛的范围:
正如你所看到的,这是一个范围,就像任何职位一样,你的经验越多,工资越高也就不足为奇了。除了多年的经验,你工作的州,你雇用的技能,公司也会努力创造最终的工资数额--所有这些职位都是如此。为了获得更多的粒度,我们可以查看不同的资历级别,以便了解级别的增加与工资数额的关系:
以下是一些来自个人经验的技能,您可以期望在机器学习职位上使用:
通常被称为NLP工程师,这个角色通常专注于将数据科学模型或机器学习算法应用于文本数据。NLP工作的一些例子是主题建模、大量文本、语义分析和chatbot代理。话虽如此,你也可以想象出相当不错的工资--然而,这个工资细目将低于机器学习工程师,很可能是因为这个角色不太包容,更专注于数据科学中的特定主题。这个特别的估计也来自于Glassdoor[5]。
根据大约20提交的工资,有以下广泛的范围:
值得注意的是,报告的工资数额相当低,所以对这个范围持怀疑态度,但尽管如此,对这个工资仍然有很高的信心。
所有这些数量都低于机器学习,然而,与大多数其他角色相比,它们仍然相当高。
以下是一些来自个人经验的技能,你可以期望在自然语言处理工程师的职位上使用:
也许一个更常见的角色是数据工程,它与数据科学比在数据科学之下更相关。然而,这个角色对数据科学工作来说仍然至关重要,有时,数据科学家可以期望知道数据工程师所知道的大部分内容,所以我将在本文分析中包括它。数据工程的一些示例包括创建存储最终用于数据科学模型的数据的ETL作业,以及自动存储模型结果和执行查询优化。这个特别的估计也来自于Glassdoor[7]。
根据大约~6,800提交的工资,有以下广泛的范围:
这个范围更类似于自然语言处理工程师的角色,然而,它可能与日常工作中的实际工作角色相距最远。同样重要的是要注意,这个职位涉及到相当多的估计。
以下是一些来自个人经验的技能,您可以期望在数据工程师职位上使用:
最后,但并非最不重要的,是数据科学家的角色。虽然这个角色看起来是最一般的,但实际上也可以是具体的,通常主要由模型构建过程组成--有时需要数据工程和机器学习工程师操作,但可能性较小--但仍然可能涉及自然语言处理方面的专业(通常如果重点是NLP,那么数据科学家将以此为标题--但不是一直)。这个角色还可以有更多的可变性,所以我们也可以期待一个广泛的范围。这个特别的估计也来自于Glassdoor[9]。
根据大约~16,200提交的工资,有以下广泛的范围:
出人意料地低于预期,这一角色在本分析中的大多数其他角色附近。话虽如此,它可能是对离群值最真实和稳健的,因为它是迄今为止提交来组成这些工资数额的最多的工资数额。
以下是一些来自个人经验的技能,您可以期望在数据科学职位上使用:
While these roles can have several similarities and differences, the same can be said about their salary ranges. Nearly three of the four salaries were similar, with one standing out. That role was machine learning engineer —why is that?My understanding is that this role requires a knowledge of most data science concepts, and especially their output, as well the software engineering involved around deployment — that is a lot to know and employ, so it makes sense why a role that composes both software engineering and data science pays so well. In addition to the salary breakdown of each data science role — or similar to data science in some way, were the skills that you can expect to employ, so that you can have a better idea of the role and how that relates to the salary amount.
总结一下,以下是我们分析的四个职位,以及你可以期望使用的技能:
我希望你觉得我的文章既有趣又有用。如果你同意这些数字和范围,请随时在下面发表评论--为什么或为什么不?你认为有一个角色,尤其是,离现实如此之远吗?你还能想到哪些数据科学角色会有不同的工资细分吗?一个角色的其他因素会影响薪水吗?
这些薪金是在美国报告的,因此它们是以美元数额计算的。我与这些公司中的任何一家都没有关联。
请随时查看我的个人资料和其他文章,并在LinkedIn上联系我。
[1] Photo byThought CatalogonUnsplash, (2018)
[2]Photo Byassed PhotographyonUnsplash,(2018)
[3]Glassdoor,Inc.,机器学习工程师工资,(2008-2021)
[4]Photo Bybatrick TomassoonUnsplash,(2016)
[5]Glassdoor,Inc.自然语言处理工程师工资,(2008-2021)
[6]Caspar Camille RubinonUnsplash的照片,(2017)
[7]Glassdoor,Inc.,数据工程师工资,(2008-2021)
[8]照片byDaria NepriakhinaonUnsplash,(2017)
[9]Glassdoor,Inc.,数据科学家工资,(2008-2021)
Bio: Matthew Przybyla is Senior 数据科学家 at Favor Delivery, and a freelance technical writer, especially in data science.
原创。经允许转发。
相关:
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16