京公网安备 11010802034615号
经营许可证编号:京B2-20210330
这篇文章是为那些属于下列类别之一的人准备的:
你可能在想,“我有机会吗?”
答案是:“是的,有可能。”
好消息是,您已经通过了第一步,这就是您对数据科学感兴趣。现在这将不是一个容易的旅程,因为您是一个失败者,但要把它作为每天激励自己的燃料。
最重要的是,我要给你我的建议,我希望我在开始的时候有。
首先,介绍一下我自己…
我有商科学位,但从大学二年级开始,我就对机器学习感兴趣。因此,我自学了我今天所知道的大部分知识,我很幸运地在几个数据分析师/数据科学工作中工作。
我为什么要告诉你这些?我想说清楚,我曾经和你处于类似的位置!
请记住,这是一个长期目标,因此您应该期待长期的结果。如果你愿意付出100%的努力,我会给你至少一年的时间来决定是否继续下去。
说到这里,让我们潜入其中:
进入数据科学可以归结为两件事,增长和展示您的技能。
不久前,我写了一篇文章,“如果我可以重新开始,我将如何学习数据科学。”在这篇文章中,我将学习的内容按学科划分,即统计与数学、编程基础和机器学习。
在这篇文章中,我将根据你的理解水平来划分你应该学习的内容。
级别0:基本原理
你必须从基础开始,构建块,无论你想怎么称呼它。但是相信我,当我说这些的时候,你的基础越好,你的数据科学之旅就会越顺利。
特别是,我建议您在以下主题中建立基础知识:统计与概率、数学和编程。
统计和概率:如果你读过我以前的文章,那么你可能已经听过第一百万次了,但是数据科学家实际上只是一个现代统计学家。
数学:取决于你在高中时的注意力,这将决定你需要花多少时间学习基础数学。您应该学习以下三个方面:微积分、积分和线性代数:
编程:就像对数学和统计数据有一个基本的理解是很重要的一样,了解编程中的核心基础知识会使您的生活变得容易得多,尤其是在实现方面。因此,我建议您在深入研究机器学习算法之前,先花时间学习基本的SQL和Python。
级别1:专门化
一旦你学会了基础知识,你就准备好专门化了。在这一点上,你是否想专注于机器学习算法、深度学习、自然语言处理、计算机视觉等就取决于你了…
你可以专攻的东西还有那么多,所以在你做决定之前,请多探索一下!
第2级:练习
像其他任何事情一样,你必须练习你学到的东西,因为你失去了你不用的东西!以下是我推荐的3个资源,可以用来练习和改进你的技能。
学习数据科学是一回事,但人们通常忘记的是营销自己--你最终会想展示你学到的东西。如果您没有与数据科学相关的学位,这对您来说尤其重要。
一旦你完成了几个个人数据科学项目,下面是你展示它们和推销自己的几种方法:
您的简历
首先,利用你的简历展示你的数据科学项目。我建议创建一个名为“个人项目”的部分,在那里你可以列出你已经完成的两到三个项目。
同样,您也可以在LinkedIn上的“projects”部分添加这些项目。
GitHub存储库
如果您还没有创建Github存储库,我强烈建议您创建一个Github存储库。当我们讨论Github的主题时,学习Git将是一个好主意。在这里,您可以包含所有的数据科学项目,更重要的是,您可以与其他人共享您的代码以供查看。
如果你有一个Kaggle帐户,并在Kaggle上创建笔记本,这也是一个很好的选择。
一旦你有了一个活跃的Kaggle或Github账户,确保你的账户URL在你的简历、领英和网站上都有。
个人网站
说到网站,我强烈建议以网站的形式建立一个数据科学投资组合。HTML和CSS是非常简单的学习,这将是一个有趣的项目!如果你没有时间,像Squarespace这样的东西也会很好地工作。
中型博客
我有偏见,因为这对我来说很有效,但这并不意味着我不能推荐写博客!使用像Medium这样的平台,您可以编写项目演练,就像我的onWine Quality Prediction一样。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12