京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据科学家泰勒·理查兹@脸书
大约每个月,我都会收到一封电子邮件,问我如何进入数据科学,我已经回答得够多了,所以我决定把它写在这里,这样我就可以把人们链接到它。所以如果你是这些学生中的一员,欢迎!
我将把它分成基本的建议,如果你只在谷歌上搜索“如何进入数据科学”,就可以很容易地找到这些建议,以及不太常见的建议,但我多年来发现这些建议非常有用。我将从后者开始,然后转向基本建议。显然,对此要半信半疑,因为所有的建议都带有一点生存偏见。
1。查找坚实的社区
如果你在大学里,在那里的一半意义是找到像你这样聪明、有抱负、有动力的人来学习和成长。对我的母校来说,这个社区是数据科学和信息学俱乐部。社区/网络帮助你开始,让你保持动力,并且是获得实习和长期全职工作的关键。
2。将数据科学应用于您喜欢的事物
擅长任何事情都很难(杜),将数据科学应用到你关心的领域或领域可以帮助你保持动力并脱颖而出。我举了几个例子:Usinguf(母校)的学生政府选举,学习机器学习方法,或者通过记录我们的乒乓球比赛来跟踪我朋友的Elo成绩。这些项目教会了我基本的技能,但没有明显的工作感觉。
获得代表你将来想要执行的工作的有用的实践是至关重要的,因为通过这种实践,你只能得到两件事中的一件:
a.意识到你实际上并不喜欢这种类型的数据科学,在这种情况下,你应该立即停止阅读
B.你可以很容易地写(博客)或谈论(给想付钱给你的人)的宝贵经验
这就引出了我的下一个观点。
3。尽量减少“能力证明点击”
招聘人员会花15秒在你的简历上,潜在团队会花1-5分钟(最多)在你的简历+网站/GitHub上(访问者tomy投资组合网站平均会花2分16秒再继续)。这两个群体都经常使用GPA、学校质量或科技公司数据的经验等能力指标(我称之为身份证明)。因此,你应该仔细考虑向读者发出信号所需的时间,告诉他们你可以做他们想招聘的任何工作。要考虑的一个粗略指标是点击证明能力。
如果招聘人员不得不点击Github中正确的存储库,然后点击文件,直到他们发现Jupyter笔记本中有不可读的代码(但没有注释),你就已经输了。如果招聘人员在你的简历上看到机器学习,但你需要点击5次才能看到任何ML产品或代码,你就已经输了。任何人都可以在简历上撒谎;用一个观点来迅速引导读者的注意力,你就会处于一个明显更好的位置。
在我的网站上,我想优化这个指标的方式非常清楚。浏览文本大约需要10秒钟(我敢打赌大多数人不会一直读下去),然后人们可以立即选择一个数据科学项目来查看,这些项目根据它们展示我所能做的工作的程度进行排序。对于在DS中开始,我强烈建议制作一个网站(即使是一个引导模板网站也很好),并将其托管在Github页面或heroku上。
4。通过研究或入门级工作学习
在你做了这三件事之后,看看你是否能说服某人付钱给你学习数据科学。我喜欢UF有一个很棒的选举数据科学小组(麦克唐纳博士和史密斯博士目前负责),但如果你去任何一个研究小组采访他们,他们可能会为你的工作付钱。最终,有了这样的经验,你就可以申请实习并获得丰厚的报酬。这里的关键是不要一开始就寻找那些令人难以置信的花哨的DS实习机会,而是在当地有数据科学任务但没有足够的钱雇佣一名全职数据科学家的公司或研究小组。数据科学学习快速复合,所以现在就开始吧!考虑到所有这些,让我们继续讨论更基本的建议。
数据科学主要是应用于任何领域的编程和统计,所以这两个领域的背景是至关重要的。
1。统计信息
尽快获得一个良好的统计背景(参加课程,在线学习)。教科书会带你走得更远,好奇心会带你走得更远。
书籍/资源:
2。编程
学习Python或R,并真正擅长它。每天做一些新的事情,每周至少花5-10个小时在上面。在此之后学习SQL。你不能跳过这个。
书籍/资源:
3。业务经验
在宝洁,我的数据科学工作被应用于零售业。在脸书,诚信问题。保护民主,呃,民主。学习数据科学在某些业务环境中的应用是很困难的,需要实践,并且通常涉及到对度量、产品分析和激励结构的扎实理解。这非常符合第二个不太基本的建议。
学习数据科学很难,但我发现它非常有价值。我给你的最后一个提议,作为阅读这篇长篇文章的交换,是说一旦你把数据科学应用到你感兴趣的问题上,并把它发布到网上的某个地方,在推特上把它写给我,我保证会阅读并转发它。祝你好运!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04 很多数据分析师拿到数据就开始清洗、建模,但当被问到“这批数据属于什么类型——结构化还是非结构化?分类变量还是数值变量 ...
2026-06-04在问卷调查与社会科学数据分析中,卡方检验是最常用、最基础的非参数检验方法,广泛应用于市场调研、用户分析、行为统计、满意度 ...
2026-06-03【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-03 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-06-03逻辑回归是数据分析、机器学习、统计建模中应用最广泛的二分类预测模型,常用于风险判断、行为预测、归因分析等场景。在SPSS、Py ...
2026-06-02数字经济时代,市场竞争日趋同质化,用户消费需求愈发个性化、多元化,传统依托经验、粗放式、广撒网的营销模式弊端日益凸显。长 ...
2026-06-02 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-06-02在市场竞争日趋饱和、用户需求不断细分的当下,企业创业创新、产品迭代与市场拓展不再依赖经验决策,而是需要系统化、工具化的商 ...
2026-06-01【核心关键词】调度、岗位、数据库、企业、报表、培训、程序、数据分析、数据加工、业务部门、企业数据、调度工具、业务指标、 ...
2026-06-01 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-06-01在数据统计分析、数据清洗、异常值识别与数据分布研究中,箱型图是最直观、高效、专业的可视化分析工具。相较于柱状图、折线图仅 ...
2026-05-29Tkinter是Python内置的标准GUI图形界面库,具备无需额外安装、调用简单、兼容性强、轻量化高效等优势,是Python快速开发桌面小程 ...
2026-05-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-05-29【核心关键词】大数据、经理、专业、金融、客户、传统、建模、数据产品、互联网金融、产品经理、数据分析、金融行业、数据模型 ...
2026-05-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-05-28