
世界上任何有规模的现代公司都有一个数据科学部门,一家公司的数据工程师可能与另一家公司的营销科学家有相同的职责。数据科学工作没有很好的标签,所以一定要广撒网。
分享69
在科技界的所有角色中,数据科学家的头衔和工作职责的变化可能是最大的。数据科学家必须戴上很多不同的帽子,亚马逊的数据科学家的日常工作可能与微软的数据科学家的工作有很大不同。从找到公司业务中可以从收集、分析和理解数据中受益的领域,到决定必须做出什么战略决策以提高客户满意度或购买完成率,公司可以向数据科学家提出很多要求。
一个数据科学家被期望拥有专业的统计学、机器学习,通常还有经济方面的技能和知识。一个数据科学家需要在数学、统计学、机器学习、可视化、沟通和算法实施方面有很高的技能。
此外,数据科学家必须彻底了解其数据的商业应用。如果你在分析树木的生长数据,你应该了解高度和树冠基部高度之间的区别。这种背景知识可以在工作中培养,但如果你想成为一名数据科学家,如果你已经有了行业工作经验,这可能是一个很大的优势。如果你已经做了五年的银行家,那么你在金融科技领域获得数据科学职位的几率要比在医疗保健领域好得多。
数据科学家所戴的各种帽子
数据科学是一个相对较新的领域,对于不是数据科学家的人来说,要向普通人解释数据科学家的工作可能很困难。这就导致了现代数据科学家有时会有各种滑稽的职责和头衔可以适用。
一个数据科学家,根据公司和具体的工作,可以负责数据收集和清理。你也可能被要求开发机器学习模型和管道,或作为可视化大师为公司服务。一些数据科学家更多的是面向内部,而另一些则与内部的、非技术团队甚至客户有很多关系。如果你和技术性不强的人一起工作,你就必须有出色的沟通技巧,既要写报告来总结你的分析,也要介绍你的发现,并为未来的行动提出建议。
数据科学家(或者你们公司对收集、分析、可视化或预测数据的人的任何称呼)的关键职责是讲述数据的故事。它是从哪里来的,我们可以从它那里了解到过去的情况,以及它如何在未来指导我们?为了成功地做到这一点,你需要成为业务领域的专家,或者拥有背景知识,将拼图的碎片拼凑起来,并向你周围的人解释数据的意义和你从中获得的洞察力。
数据科学领域内的具体职责差别很大,而且数据科学领域内有很多不同的角色。无论你是想进入这个领域还是想转换工作,在工作职位和行业方面保持开放的心态真的很重要。我给你分析一下数据科学领域内十三个不同角色的一般职责。
公司一般不善于给数据科学领域的人冠以头衔,所以你一定要把这个细目作为一个经验法则,而不是一个确切的定义。如果其中一个听起来很完美,那么你可以把你的搜索范围缩小到这一个头衔,但如果其中几个听起来都不错,那么我会在搜索时对你使用的头衔更加灵活。(如果头衔对你来说真的很重要,当你得到工作机会时,你总是可以把它作为你谈判的一部分!)
世界上任何有规模的现代公司都有一个数据科学部门,一家公司的数据工程师可能与另一家公司的营销科学家有相同的职责。数据科学工作没有很好的标签,所以一定要广撒网。
数据科学家的职责按角色细分
1. 数据分析师
数据分析师更注重于数据的收集、清理和汇总。你必须能够自如地驾驭复杂的SQL查询。你将负责设计并向非技术性的利益相关者提供报告。你也会有机会设计数据模型、可视化和预测模型。
2. 数据库管理员
数据库管理员管理数据库实例,包括内部和云实例。作为一名数据库管理员,你要建立、配置和维护生产环境。你还将负责你所负责的数据库的性能、可用性和安全性。准备好带头进行数据操作并提供关键任务的随叫随到支持。
3. 数据建模员
数据建模人员创建概念性的、技术性的、逻辑性的、有时是物理性的数据模型。你必须果断地选择和维护数据建模和设计标准,为你公司的数据创造一个有凝聚力的愿景。
数据建模人员还必须开发实体关系模型和设计数据库。你可能需要为你的团队或公司改进数据收集和分析代表性不足的数据类别,以确保你的数据集具有代表性。
4. 软件工程师
软件工程师设计和维护软件系统。当你成为一名软件工程师时,准备好编写可扩展、可靠和高性能的代码。你必须将设计要求转化为有据可查、经过良好测试的代码,将产品设计师的设想变为现实。
5. 数据工程师
识别和解决数据质量挑战将是你作为数据工程师的一项重要任务。你还需要支持将数据源纳入数据存储解决方案。数据工程师工作的一个令人兴奋的部分是有机会架构和设计数据工程解决方案。你还应该准备好建立ETL管道,以提取、转换和加载数据到数据仓库,用于下游报告。数据工程师还负责数据复制、提取、加载、清理和整理。
6. 数据架构师
数据架构师主要负责设计和维护数据管道。数据架构师工作的另一个重要部分是管理数据库。作为一个数据架构师,你将编写高效的查询,并优化现有的查询,以最大限度地提高可扩展性和成本效益。你还将把数据转化为可操作的报告、自动化和洞察力。
7. 统计员
统计学家了解业务需求,提出假设,并构建统计学上合理的实验。作为一名统计员,你将验证其他业务组的实验计划的统计有效性。你还需要指导和培训项目或研究主任开发统计学上合理的实验和验证策略或指标。
除了实验之外,统计员还要制定和执行分析报告策略。你可能需要像一个统计学的拉拉队员一样,因为一些数据科学公司让他们的统计员积极推广统计学方法,并发现可以从统计学上的分析中获益的新业务领域。
8. 商业智能分析师
商业智能分析员是数据科学中比较柔和的一面。作为一个商业智能分析师,你需要收集业务和功能需求,并努力使技术解决方案与业务战略保持一致。你还将致力于创建或发现数据采购和处理策略。
你将负责提取和处理大量的数据,从中创建分析报告。商业智能分析师还将向关键的利益相关者报告、介绍和沟通分析结果。
9. 营销科学家
营销科学家向当前和潜在的客户展示想法和发现。他们还将数据挖掘和分析策略应用于数据,如人口统计或营销数据。根据Stone Alliance Group对营销科学家的描述,你必须 "跟踪和评估客户获取工作、市场趋势和客户行为"。营销科学家是专门从事广告、营销或用户/客户人口统计学数据的数据科学家。
10. 商业分析师
根据MaxisIT Inc的要求,业务分析师 "分析业务和用户需求,记录需求,并设计系统和报告的功能规格"。如果你是一名业务分析员或想成为一名业务分析员,你需要了解业务和行业要求,并利用它们来制定系统范围和技术目标。你还将负责定义不同系统和数据库之间的数据互动。
11. 量化分析员
定量分析员使用大型数据集开发复杂的模型,为内部报告提供信息,并产生商业洞察力。资源开发协会让他们的定量分析员 "开发和领导分析计划的实施,概述研究方法、问题、抽样和迭代计划"。定量分析员还将工作流程自动化,并努力验证数据的完整性。
12. 数据科学家
作为一名数据科学家,你将被期望从多个来源提取、汇总、清理和转换数据。你将需要确定问题的重要背景因素。数据科学家通过分析数据,为企业产生关键的可操作的见解,以提高业绩。根据公司的情况,你可能需要预测市场趋势,以帮助公司战略性地发展其分支机构。
数据科学就是要在短期分析指导和长期预测和实验之间找到平衡。你需要在正确的时间沟通重要的事情,所以你能以可消化的媒体--数据可视化和吸引人的、深思熟虑的演讲--来呈现研究结果,这一点至关重要。
作为一名数据科学家,你将为非技术性的利益相关者带来数据的价值和洞察力。你将有机会主动找到公司内部可以从数据驱动的决策中受益的领域,并与其他团队合作来完成这一任务。
13. 机器学习工程师
为生产建立机器学习模型是机器学习工程师的主要重点。他们设计和实施可扩展的、可靠的、性能良好的数据管道和服务。根据公司和它的重点领域,你可以改善产品的个性化,或者通过将机器学习模型应用于历史和实时数据,更好地预测行业的市场趋势。
角色和职责相互交叉,区别仍然很重要
所有这些角色之间有很多交叉的地方。有些人更专注于纯粹的数字计算,而另一些人则更专注于将数据分析产生的洞察力应用于商业决策。无论你的具体职位是什么,如果你在数据科学领域,你将被期望参与数据驱动的产品开发周期中的许多不同步骤。你应该准备好发现新的优化领域,弄清楚重要的指标,寻找数据来告知这些指标,设计和执行实验,并以简洁、准确和令人信服的方式展示实验/模型的结果。
数据科学领域很年轻,定义也很松散。很多时候,你会发现在数据科学的大伞下,不同的工作头衔下的工作描述听起来惊人的相似。公司往往意识到他们有数据或可以收集数据,然后用它来改善他们的商业模式。然而,这些工作描述和他们选择分配的工作头衔往往是由非技术人员撰写的,这意味着有很多重叠之处。
一家公司的数据工程师可能与另一家公司的数据分析师做同样的工作。所有这些职位都涉及到收集或验证数据,应用某种形式的分析,然后通过报告、预测或可视化向非技术类同事解释结果。
如果这些工作中有一个听起来很完美,那么你可以把搜索范围缩小到这一个职位,但如果其中有几个听起来不错,那么我会在搜索时对你使用的标题更加灵活。如果头衔对你来说真的很重要,当你得到工作机会时,你总是可以把它作为你谈判的一部分。不要让这份责任清单把你从一份听起来很有趣的工作中吓跑了。如果你真的想成为一个数据建模者,但你对组织行文信息不适应,你可以看看不同公司的数据建模者职位或数据架构师职位。
让这十三种最常见的数据科学角色的细分成为你寻找数据科学工作的跳板。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29CDA 数据分析与量化策略分析流程:协同落地数据驱动价值 在数据驱动决策的实践中,“流程” 是确保价值落地的核心骨架 ——CDA ...
2025-08-29CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-28CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-08-28