
数据科学家泰勒·理查兹@脸书
大约每个月,我都会收到一封电子邮件,问我如何进入数据科学,我已经回答得够多了,所以我决定把它写在这里,这样我就可以把人们链接到它。所以如果你是这些学生中的一员,欢迎!
我将把它分成基本的建议,如果你只在谷歌上搜索“如何进入数据科学”,就可以很容易地找到这些建议,以及不太常见的建议,但我多年来发现这些建议非常有用。我将从后者开始,然后转向基本建议。显然,对此要半信半疑,因为所有的建议都带有一点生存偏见。
1。查找坚实的社区
如果你在大学里,在那里的一半意义是找到像你这样聪明、有抱负、有动力的人来学习和成长。对我的母校来说,这个社区是数据科学和信息学俱乐部。社区/网络帮助你开始,让你保持动力,并且是获得实习和长期全职工作的关键。
2。将数据科学应用于您喜欢的事物
擅长任何事情都很难(杜),将数据科学应用到你关心的领域或领域可以帮助你保持动力并脱颖而出。我举了几个例子:Usinguf(母校)的学生政府选举,学习机器学习方法,或者通过记录我们的乒乓球比赛来跟踪我朋友的Elo成绩。这些项目教会了我基本的技能,但没有明显的工作感觉。
获得代表你将来想要执行的工作的有用的实践是至关重要的,因为通过这种实践,你只能得到两件事中的一件:
a.意识到你实际上并不喜欢这种类型的数据科学,在这种情况下,你应该立即停止阅读
B.你可以很容易地写(博客)或谈论(给想付钱给你的人)的宝贵经验
这就引出了我的下一个观点。
3。尽量减少“能力证明点击”
招聘人员会花15秒在你的简历上,潜在团队会花1-5分钟(最多)在你的简历+网站/GitHub上(访问者tomy投资组合网站平均会花2分16秒再继续)。这两个群体都经常使用GPA、学校质量或科技公司数据的经验等能力指标(我称之为身份证明)。因此,你应该仔细考虑向读者发出信号所需的时间,告诉他们你可以做他们想招聘的任何工作。要考虑的一个粗略指标是点击证明能力。
如果招聘人员不得不点击Github中正确的存储库,然后点击文件,直到他们发现Jupyter笔记本中有不可读的代码(但没有注释),你就已经输了。如果招聘人员在你的简历上看到机器学习,但你需要点击5次才能看到任何ML产品或代码,你就已经输了。任何人都可以在简历上撒谎;用一个观点来迅速引导读者的注意力,你就会处于一个明显更好的位置。
在我的网站上,我想优化这个指标的方式非常清楚。浏览文本大约需要10秒钟(我敢打赌大多数人不会一直读下去),然后人们可以立即选择一个数据科学项目来查看,这些项目根据它们展示我所能做的工作的程度进行排序。对于在DS中开始,我强烈建议制作一个网站(即使是一个引导模板网站也很好),并将其托管在Github页面或heroku上。
4。通过研究或入门级工作学习
在你做了这三件事之后,看看你是否能说服某人付钱给你学习数据科学。我喜欢UF有一个很棒的选举数据科学小组(麦克唐纳博士和史密斯博士目前负责),但如果你去任何一个研究小组采访他们,他们可能会为你的工作付钱。最终,有了这样的经验,你就可以申请实习并获得丰厚的报酬。这里的关键是不要一开始就寻找那些令人难以置信的花哨的DS实习机会,而是在当地有数据科学任务但没有足够的钱雇佣一名全职数据科学家的公司或研究小组。数据科学学习快速复合,所以现在就开始吧!考虑到所有这些,让我们继续讨论更基本的建议。
数据科学主要是应用于任何领域的编程和统计,所以这两个领域的背景是至关重要的。
1。统计信息
尽快获得一个良好的统计背景(参加课程,在线学习)。教科书会带你走得更远,好奇心会带你走得更远。
书籍/资源:
2。编程
学习Python或R,并真正擅长它。每天做一些新的事情,每周至少花5-10个小时在上面。在此之后学习SQL。你不能跳过这个。
书籍/资源:
3。业务经验
在宝洁,我的数据科学工作被应用于零售业。在脸书,诚信问题。保护民主,呃,民主。学习数据科学在某些业务环境中的应用是很困难的,需要实践,并且通常涉及到对度量、产品分析和激励结构的扎实理解。这非常符合第二个不太基本的建议。
学习数据科学很难,但我发现它非常有价值。我给你的最后一个提议,作为阅读这篇长篇文章的交换,是说一旦你把数据科学应用到你感兴趣的问题上,并把它发布到网上的某个地方,在推特上把它写给我,我保证会阅读并转发它。祝你好运!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29CDA 数据分析与量化策略分析流程:协同落地数据驱动价值 在数据驱动决策的实践中,“流程” 是确保价值落地的核心骨架 ——CDA ...
2025-08-29CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-08-28CDA认证:数据时代的职业通行证 当海通证券的交易大厅里闪烁的屏幕实时跳动着市场数据,当苏州银行的数字金融部连夜部署新的风控 ...
2025-08-28