给有抱负的数据科学家的建议--回答你最常见的问题-CDA数据分析师官网

热线电话：13121318867

首页大数据时代给有抱负的数据科学家的建议--回答你最常见的问题

给有抱负的数据科学家的建议--回答你最常见的问题

2022-03-14

罗曼·奥拉克，数据科学家。

我收到许多信息，向有抱负的数据科学家寻求建议。我不是职业建议方面的专家，所以对我写的一切都持怀疑态度。

我根据我对这个领域的观察和我多年来积累的经验给出建议。这是我，建议年轻的我，因为我有类似的问题，在我的职业生涯开始。

学习和实践数据科学的最佳方式是什么？

我的建议是从实际项目开始，然后慢慢地进行理论研究。Kaggle笔记本是学习实际部分的好方法。

在Reddit社区或交叉验证社区中提问。

当您对自己的工具和实践知识感到满意时，我建议您自己为某些问题构造数据集（例如，您可以刮取数据），并对其应用ML算法。ML中最难的是数据集的构造。你甚至可以用它建立一个公司。

Kaggle是学习实际部分的一个很好的方法。

学习机器学习的好资源是什么？

我建议您从免费资源开始，因为有许多免费资源可用于编程、机器学习和数据科学：

2020年每个数据科学家都应该阅读的7本免费电子书
2020年每个数据科学家都应该阅读的7本免费编程书籍
来自常春藤盟校的7大免费人工智能课程

我个人很喜欢吴恩达的Machine LearningCoursera课程。这门课程开始很容易，然后随着它的进行逐渐变得困难。它的优点在于它专注于机器学习的基础知识。

我建议你至少听前几堂课。如果你不明白所有的事情，也不要担心，因为你可以在以后重温它。我也建议你不要只专注于一个课程。我们学得都不一样，没关系。

我们学得都不一样，没关系。

我几乎没有任何技术背景。你认为最好的学习方法是什么？

不要一个人学习！寻找并加入能帮助你学习和成长的在线社区。我在以下文章中写过关于数据科学社区的文章：

在家工作时的数据科学

您可以开始在Excel中练习机器学习。尝试在Excel中实现线性回归。这是一个很好的第一个挑战，它会让你有动力。

开始在Excel中练习机器学习。

我应该学Python还是R？

让我们对房间里的大象讲话。如果您刚刚起步，我建议您学习Python。主要原因有：

丰富的数据科学生态系统，后端…你说什么，Python都有。
这种语言的流行势头仍在增强。

使用Python，您可以进行分析，从头开发模型，然后在生产中运行它。虽然我确信R中的模型也在生产中运行，但我还没有听说过（如果您的经验不同，请在评论中告诉我）。

别误会，如果你知道R，那完全没问题。数据科学团队通常使用这两种语言，一些人喜欢R，另一些人喜欢Python。

最后，这并不重要，因为有些模型必须用编译语言(Java，Go)重新实现，以便在生产中做出更快的预测。

Python使您能够进行分析、从头开发模型并在生产中运行它。

我应该学习SQL吗？

这是个很棒的问题。答案是肯定的--用大写字母。

无论您是否使用SQL数据库，您都应该了解关系数据库中的主要概念，如joins、group by、window functions、lag、lead等。即使在使用pandas、R或其他工具时，这些概念也是必不可少的。

如果您感兴趣，我还写了几篇关于SQL的文章：

编写SQL查询时的5个错误
不要在SQL中重复这5个错误

答案是肯定的--用大写字母。

我应该多上数学课吗？

你知道的数学越多，从长远来看对你越好。了解数学将使您能够理解黑匣子机器学习模型的幕后发生了什么。从理论到实践的知识转移也更容易。

有了数学，你就会明白黑匣子模型的幕后发生了什么。

数学和统计学在数据科学中重要吗？

当你需要改进模型时，数学就变得至关重要。您需要数学来理解不同类型的模型、发行版等之间的差异。

资深机器学习工程师只需看优化函数就能说出一个模型的主要性质。

当你试图改进模型时，数学变得至关重要。

我应该上哪些课才能更好地为数据科学角色做好准备？

我的建议是提前考虑。每个领域都需要一名数据科学家，或者将来也会需要。问问自己，完成学业后，你希望在哪家公司实习？如果你已经听过一些相关的课程，就更容易获得生物信息学的实习机会。

提前想想。

我需要博士学位吗。从事数据科学工作？

你不需要博士学位。从事数据科学工作--意味着对现实世界的数据进行分析，并应用机器学习模型。

如果你的目标是做研究和开发新的机器学习算法（例如，在Deep Mind工作），那么你应该攻读博士学位。

你不需要博士学位。从事数据科学工作，但是...

如何获得你在数据科学领域的第一份工作？

参加LocalMeetups。公司在那里寻找新雇员。也许从数据质量评估部门开始--大公司有这些。在线社区也能有所帮助。

参加当地的聚会。

我怎么知道哪份工作有最好的导师？

最近，我写道，“当你有多个工作机会时，接受一个有更好导师的工作机会。”

你怎么知道哪家有最好的导师？在面试过程中尽可能多地了解团队成员、经理、他们的背景等信息。查看他们的LinkedIn。他们在Quora、StackOverflow、Medium上写吗？做你的研究。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

机器学习 SQL 线性回归数据质量 pandas 数据质量评估人工智能

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇从软件到机器学习工程师的旅程

下一篇我迄今为止的数据科学学习之旅

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

给有抱负的数据科学家的建议--回答你最常见的问题

学习和实践数据科学的最佳方式是什么？

学习机器学习的好资源是什么？

我几乎没有任何技术背景。你认为最好的学习方法是什么？

我应该学Python还是R？

我应该学习SQL吗？

我应该多上数学课吗？

数学和统计学在数据科学中重要吗？

我应该上哪些课才能更好地为数据科学角色做好准备？

我需要博士学位吗。从事数据科学工作？

如何获得你在数据科学领域的第一份工作？

我怎么知道哪份工作有最好的导师？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA持证人专访：贺译册谈产品经理的市场洞察力与数 ...

【CDA干货】多维度对比评估：分析逻辑与可视化效果 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

【CDA干货】漏斗拆解：核心逻辑、实操方法与业务优 ...

【CDA干货】SQL数值转日期函数全解析：主流数据库语 ...

数据分析必修课：CDA数据分析师视角下的表格结构数 ...

CDA持证人专访：杨旭谈数据产品经理的工作实践与核 ...

【CDA干货】Python变量定义与类实例化：核心原理、 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】联合索引与覆盖索引：本质区别、实战场 ...

【CDA干货】维度表与事实表：数据仓库建模的核心逻 ...

从“指标堆砌”到“体系落地”：CDA数据分析师视角 ...

【CDA干货】SQL计算列值趋势的全场景实现方法与实战 ...

【CDA干货】用户决策链路全解析：从认知到复购的增 ...

CDA 三级《敏捷数据挖掘》教材知识体系全面解读 ...

【CDA干货】付费玩家流失的核心原因与游戏行业长效 ...

CDA持证人专访：蒋少寒谈传统制造业与互联网行业数 ...

学完商业数据分析，开启 CDA 量化策略：从业务思维 ...

CDA持证人专访：赵森淼谈药企数据分析从业体验与转 ...

【CDA干货】卡方检验与T检验结果的标准化解读方法及 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载