6年时间经历8家公司，我的数据科学从业心得-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读6年时间经历8家公司，我的数据科学从业心得

6年时间经历8家公司，我的数据科学从业心得

2019-11-13

作者 | Cameron Warren

来源 | 图灵TOPIA

近日，数据科学家Cameron Warren就数据科学和商业的交集，以及传统数据科学思想的挑战，发表了自己的看法。

过去的6年间， Warren在Adobe, USAA Bank, Nu Skin, Purple Mattress, Franklin Sports等多家公司从事数据科学和分析项目，也在分析领域的四家公司工作过。

他的职业生涯始于“数据科学家”，这项工作被评为“21世纪最性感的工作”。

在6年的时间里，他了解了不同的公司是如何构建、参与和执行数据项目的，并且采访了9家不同的公司，就数据科学家和其他职务进行了分析，并深入了解了公司如何组建数据团队，以及雇用人员的方式。

此外，Warren的这些经验和知识完全是通过导师指导，自学，MOOC课程或在职工作获得的。

他的正式学位是 Latin American (BA) and International Studies (MA)，并且几乎没有接受过正式的技术训练。

以下是Warren的分享：

企业数据科学和分析团队是为了解决业务问题

这似乎应该是不言自明的，但不知何故，它不是。我曾无数次看到数据项目失败，在这个过程中，数据团队忘记了自己存在的理由。

数据团队都是一种支持功能，旨在解决合法的业务问题——也就是说，这些问题要么会为公司带来收入，要么会为公司节省资金，仅此而已。

曾经有一个数据科学家告诉我，他花了整整3天时间在预测模型的一个新特性,但公司告诉他这是没必要的，因为所讨论的预测模型预足以满足他们的需求。

技术性的DS和DE喜欢进行修补并深入研究代码。它满足了完善预测模型的需要，并努力保持最后2％或5％的准确性。不幸的是，你从80%的AUC到85%所花的时间可能是一样的。

作为数据专业人员，你的价值取决于模型、管道或数据产品节省或生成的美元。让数据科学家花3天时间修改一个新特性，会损失多少美元?

我并不是说对一个数据科学家来说进行实验是不重要，事实上，这对于一个好的数据科学家来说，实验是至关重要的。

然而，专注于提供ROI更重要。为了提高生产力和实用性，发展能够解决复杂性和不必要的优化的能力，会让数据科学家做得更多，并且能提供更多价值。

几种不同的“数据科学家”

数据科学家是21世纪最性感也是最令人费解的工作。即使他们认为他们愿意，也没有公司愿意雇佣相同的数据科学家。

正如之前的一篇文章中所解释的，数据科学是一个广泛的领域，而不是一个具有三维技能的职位名称。

我厌倦了关于什么是或不是“真正的”数据科学家的争论。这是一个人力资源的问题，并不适用于公司真正需要的东西。

事实上，大多数组织真正需要的是能够整合一系列数据源、创建一些简单模型并实现自动化的人。

这些技能不需要博士学位或高级技术学位，但仍然可以为许多公司提供难以置信的价值。

话虽如此，但是对于高度专业化、受过高等教育的统计学家或研究人员来说，肯定有重要的位置需要他们，这种需求是由不同公司面临的挑战所创造的，而不是作为“数据科学家”角色的笼统要求。

数据工程比数据科学更重要

与开发和调优预测模型的能力相比，数据科学家更需要一种能力，即从那些不用于相互通信的数据源中缝合和组织完全不同的数据集。

除非公司在有限的规则集和业务场景下，面临难以置信的挑战，否则对复杂预测模型的需求将会受到限制。

刚开始涉足数据科学领域就想参与竞争吗？首先得学习数据工程师的技能，然后弄清楚建模和预测。

如果你决定沿着预测的道路前进，那么对于几乎所有雇用你的公司，你都将变得更有价值，而且你还将创建比同事更好的模型。

与长期进行预测性建模和调整相比，高级SQL，Web抓取，API开发和数据清理技能带来更多收益。

领导者倾向于雇佣像他们一样的人

许多数据科学的领导者(以及一般的领导者)坚持这样的观点，即为了解决复杂的挑战，他们应该雇佣最专业的人(在许多情况下，雇佣那些拥有尽可能接近自己经验的人，而不是更有成就的人)。

就数据科学而言，公司通常的想法是:我雇佣的数据科学家越有资格，我就能解决越复杂的数据挑战。不幸的是，事实远非如此。

这种思想被称为“‘Local Seach”，也就是说，使用来自单个领域的专家，尝试用以前有效的解决方案来解决现有问题。

虽然感觉上这个想法是正确的，但它缺少了关键的“由外而内”的思维方式，比如把经验和想法联系起来的能力，而这种能力可以解决训练以外的问题。

爱泼斯坦在《范围》一书提供了“由外而内”或“横向”思维的例子。

例如，美国礼来公司(Eli Lilly)负责研究的副总裁 Alph Bingham向公司高管们提出了21项研究挑战的提议，这个提议让礼来公司的科学家们感到困惑。

起初，公司高管拒绝了这一提议，他们指出，“如果世界上受过高等教育、高度专业化、资源丰富的化学家们都被技术问题困住了，其他人又怎么能够提供帮助呢?”

最后，公司高管一致认为这个提议不会有什么坏处。

结果是令人震惊的:超过三分之一的挑战已经完全被解决，团队中包括一个完全没有科学经验的律师，但他的知识来自化学。

为了建立一个能够解决真正复杂、重要问题的团队，数据科学的领导者需要雇佣一批具有不同背景和专业知识的人。

同时，他们应该抵制建立具有相同背景甚至相同技术能力的团队。团队的经验和成就的多样性比文凭数量更重要。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

SQL

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇如何成为一名合格的数据科学家？这5个要点一定要掌握

下一篇如何在Keras中开发最大化生成对抗网络(InfoGAN)的信息？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

6年时间经历8家公司，我的数据科学从业心得

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

从“工具操作”到“方法驾驭”：CDA数据分析师视角 ...

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA “暑期学生报名送教材” 活动已开启！ ...

【CDA干货】金融行业运营风险监测：核心统计分析方 ...

【CDA干货】基于数据分析的财险潜在客户挖掘与精准 ...

从“杂乱数据”到“分析资产”：CDA数据分析师视角 ...

CDA持证人专访：何显臻谈餐饮行业数据分析与生产管 ...

【CDA干货】如何利用统计学方法开展数据分析：流程 ...

从“数据描述”到“业务预判”：CDA数据分析师视角 ...

【CDA干货】箱线图上下限计算原理、标准流程与异常 ...

【CDA干货】MySQL固定时间间隔数据查询：语法原理、 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载