如何像数据科学家一样思考-CDA数据分析师官网

热线电话：13121318867

首页大数据时代如何像数据科学家一样思考

如何像数据科学家一样思考

2022-03-30

作者Jo Stichbury，自由技术作家

数据科学是一个新兴的成熟领域，从数据工程和数据分析到机器和深度学习，各种工作职能不断涌现。数据科学家必须结合科学、创造性和调查性的思维，从一系列数据集中提取意义，并解决客户面临的潜在挑战。

从零售、交通和金融到医疗保健和医学研究，生活的各个领域都产生了越来越多的数据。

可用计算能力的增加和人工智能的最新进展将数据科学家--获取原始数据、分析数据并使其有用和可用的人--推到了聚光灯下。

根据收入潜力、报告的工作满意度和Glassdoor上的职位空缺数量等标准，自2016年以来，数据科学一直位居北美50个最佳职位榜首。

像数据科学家一样思考

那么成为一名数据科学家需要什么呢？

为了获得成功的一些技巧，我采访了Ben Chu，他是atRefinitiv Labs的资深数据科学家。

朱棣文拥有人工智能的背景，尤其是语言学、语义学和图形领域，并在新加坡路孚特实验室工作了两年。

好奇

朱棣文在我们的采访开始时说，数据科学家应该像调查人员一样思考。

你需要通过问“为什么？”来感到好奇和兴奋。“这有点像当侦探，把一个个点串起来，发现新线索。”

在金融领域，数据科学家从一系列数据集中提取意义，以通知客户并指导他们的关键决策。

数据科学家必须放大客户想要解决的挑战，并从他们正在处理的数据中获取线索。

从与朱棣文的交谈中，我了解到能够转移焦点并考虑调查的背景是多么重要。

如果不能解决根本问题，完美的分析是没有帮助的。有时你需要回头，尝试一种新的方法，重新定义你试图回答的问题。其核心是好奇心。你需要喜欢问题！

科学

数据科学家使用一系列工具来管理他们的工作流、数据、注释和代码。

“我必须非常勤奋。我需要衡量和跟踪我的进展，这样我就可以备份和尝试一个新的方向，重用以前的工作，并比较结果。

“重要的是要科学，在你前进的过程中进行观察、实验和记录，这样你就可以复制你的发现。我需要组织我的观察，所以我用概念作为我的主要工具，把我所有的笔记、论文和可视化放在一个地方。“

朱棣文强调，需要保存记录，不仅要追溯到他目前的调查，还要追溯到所有以前的发现。

“这就像数据科学日记。当我遇到类似的情况时，我会保留很好的参考点，并参考它们来指导我的下一步行动。“

有创造力

数据科学不仅仅是有一个科学的方法。职称可能会误导人；你不必来自科学背景，但你确实需要能够创造性地思考。通常，另类思维是你应对挑战的关键。

“我必须在解决问题的科学思维和引导我走上新的和不同的探索道路的创造性思维之间切换。

“逻辑的、科学的思维对帮助我得出结论至关重要，但戴上一顶创造性的帽子同样重要：我用好的和失败的例子作为观察新模式的线索。这都是关于‘编码智能’的。“

了解如何编写代码

您需要扎实的编码技能，以便能够使用各种数据处理技术对不同的数据源进行预处理，以解决噪声或不完整的数据。

您还需要能够创建机器学习管道，这将要求您知道如何构建模型，并使用工具和框架来评估和分析其性能。

Chu和大多数数据科学家一样使用Python，因为有很多优秀的包可以操作和建模数据。

事实上，Glassdoor在2017年上半年对其网站上的10,000份数据科学家工作列表进行了抽样，发现三种特殊的技能--Python、R和SQL--构成了数据科学领域大多数职位空缺的基础。

Ben Chu的团队依赖于开源机器学习包，如Tensorflow,Pytorch和Bert。

“我们主要将合流用作文档工具；用于机器学习的MLFlow,Amazon Sagemaker,Scikit-Learn、Tensorflow,PyTorch和BERT；Apache Spark在大型数据集中构建快速数据管道；和雅典娜作为我们的数据库来存储我们处理过的数据。

“我们还使用Superset来连接数据，并更容易地构建仪表板来输出图表，这使其更加直观。”

不用担心“冒名顶替综合症”

朱棣文现在是路孚特实验室的一名高级数据科学家，但他从小就想成为一名音乐家，并对语言着迷。对于我在自然语言处理领域的工作，我需要很好地理解语言学，特别是语义学和语言的细微差别。

他解释说，一个数据科学团队需要一系列的技能--他和他的同事有来自不同背景的重叠技能。

“你需要的技能将取决于你工作的领域。例如，我需要对金融有很好的了解。

“例如，数据分析正被应用于减少欺诈，通过建立异常检测方法来检测欺诈‘行为'，作为交易数据中的不规则模式。

“像我这样的数据科学家需要精通如何处理各种孤立的金融数据。知道要结合什么是至关重要的，因为没有这种理解，我就无法建立一个成功的模型。“

进入数据科学并不一定要成为一名计算机科学家或数学家。没有人在每个领域都拥有所有的专业知识。你可以有法律、经济或科学背景。都是关于你思考的方式。

如果您能够灵活和系统化，您将能够在使用工具、框架和数据集时熟悉这些工具、框架和数据集的细节。

如何开始

对于那些渴望发展数据科学技能的人，朱棣文提供了一些实用的建议，尽管新冠肺炎造成了干扰，但你可以很容易地采用这些建议。

你可以在网上寻找研究社区、参加网络研讨会和找到培训课程。一旦面对面的网络再次可行，朱建议您积极参与数据科学社区。

“去参加会议和黑客马拉松，这将帮助你建立一个强大的网络来讨论你的想法，启发你的研究，回答你的问题”。

此外，请记住，数据科学领域是一个新的领域，而且仍在不断成熟。

出现了各种不同的职位头衔，如数据科学家、数据工程师和数据分析师，以及机器学习和深度学习工程师。您可能会发现一个角色比另一个角色更适合您的兴趣和技能。

挖掘你的好奇心和创造力，提高你的Python技能，进入数据科学！

本文最初出现在2020年4月初的《路孚特透视》上。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

机器学习数据分析深度学习人工智能数据处理 SQL PyTorch 自然语言处理

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇找到你的完美适合：数据世界中的工作角色快速指南

下一篇数据科学家创业成功的六种方法

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

如何像数据科学家一样思考

像数据科学家一样思考

好奇

科学

有创造力

了解如何编写代码

不用担心“冒名顶替综合症”

如何开始

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA持证人专访：贺译册谈产品经理的市场洞察力与数 ...

【CDA干货】多维度对比评估：分析逻辑与可视化效果 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

【CDA干货】漏斗拆解：核心逻辑、实操方法与业务优 ...

【CDA干货】SQL数值转日期函数全解析：主流数据库语 ...

数据分析必修课：CDA数据分析师视角下的表格结构数 ...

CDA持证人专访：杨旭谈数据产品经理的工作实践与核 ...

【CDA干货】Python变量定义与类实例化：核心原理、 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】联合索引与覆盖索引：本质区别、实战场 ...

【CDA干货】维度表与事实表：数据仓库建模的核心逻 ...

从“指标堆砌”到“体系落地”：CDA数据分析师视角 ...

【CDA干货】SQL计算列值趋势的全场景实现方法与实战 ...

【CDA干货】用户决策链路全解析：从认知到复购的增 ...

CDA 三级《敏捷数据挖掘》教材知识体系全面解读 ...

【CDA干货】付费玩家流失的核心原因与游戏行业长效 ...

CDA持证人专访：蒋少寒谈传统制造业与互联网行业数 ...

学完商业数据分析，开启 CDA 量化策略：从业务思维 ...

CDA持证人专访：赵森淼谈药企数据分析从业体验与转 ...

【CDA干货】卡方检验与T检验结果的标准化解读方法及 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载