京公网安备 11010802034615号
经营许可证编号:京B2-20210330
有一个关于ML(机器学习)的炒作列车正在进行,许多初学者正成为这个炒作列车的受害者,因为他们是因为错误的原因进入的。你的教授会解释如何获得博士学位。如果你想变得更好,或者你的同行告诉你如何获得更好的GPU和IDE(集成开发环境),这是必要的。当您开始从在线课程中学习时,您意识到您需要更大的数据集和对Python的熟练程度。在你申请工作时学习了所需的技能后,你意识到你需要的不仅仅是几门课程或证书。最终,在得到这份工作后,你意识到这是一项要求很高的工作,有时这些工作在最初阶段的报酬并不高。
本文将帮助您度过这些失望,并为您准备好面对这些问题。我们将学习很多关于初学者进入机器学习领域所面临的现实问题。
有明确的经验证据表明,您不需要大量数学,不需要大量数据,也不需要大量昂贵的计算机。-Jeremy Howard(面向程序员的实用深度学习)
是的,如果你进入ML领域,尤其是深度学习,编码是必要的。这并不意味着您先花时间学习Python、C++或R,然后才开始学习ML。当你学习基础知识时,编码部分会自然而然地出现。您不需要记住语法或模型架构,可以从简单的google搜索中搜索它们。就这么简单。世界正在走向无代码机器学习和AutoML。AutoML是一个强大的工具,它将为您执行所有的任务,并为您提供一个工作的机器学习模型。有时你只需要写两行代码而不是两百行代码就能得到类似的结果。
是的,你需要一些数学,但为了研究和推进深度学习的边界。如果您要训练您的模型并将它们部署到生产中,那么您可能需要学习MLOps,而不是数学。
应用机器学习不需要数学,但对于任何研究和突破边界,你需要学习高级统计学。-Jakubéitní
您还需要学习模型体系结构是如何工作的,以及各种矩阵函数。这些可以在8小时的课程中教授,有时您甚至不需要学习解决问题所需的所有模型架构。我是Jeremy的超级粉丝,在他用Fastai和PyTorch为程序员编写的bookDeep Learning中,他解释说在深度学习领域有很多守门人。学者们会要求你学习高级微积分,学习所有的数学模型,最终获得博士学位。在一个特定的领域使它。但你不需要这些。我见过很多没有学位、有商业背景的人现在都是领域里的专家。所以,请专注于基础知识,学习整个课程,并通过投资组合项目开始成长。
是的,但在少数情况下。现代的深度学习模型现在能够在有限的样本数下产生高精度。随着像Kaggle这样的平台的引入,甚至获取数据集现在也变得更加容易了,Kaggle有数千个开源数据集可供下载和用于商业目的。我们还可以在GitHub、DAGsHub、HuggingFace、Knoema和Google Dataset Searchch上找到数据集来训练我们的模型,并最终将其用于生产。
有些工作确实需要机器学习学位或TensorFlow证书,但如果你在GitHub和Kaggle上有强大的投资组合,这些事情就变得次要了。许多开发人员正在向机器学习过渡,他们没有专门的学位或证书来证明,但他们确实有使用深度学习模型并将其部署到生产中的经验。如果你能以某种方式向雇主证明你可以完成机器学习生命周期中的每一项任务,那么你就是完美的候选人。总的来说,如果你有一个强大的机器学习组合,就不应该在你的脑海中获得证书或学位。要获得强大的ML投资组合,请阅读:如何作为初学者构建强大的数据科学投资组合-KDnuggets。
不,我有一台旧笔记本电脑,我可以借助Kaggle平台在云GPU和TPU上训练这些庞大的模型。世界正在从个人电脑走向云电脑。您可以从Kaggle和Google Colab获得免费的CPU、GPU和TPU。还有其他平台也可以帮助您进行数据分析和创建完整的项目,如DeepNote、JetBrains Datalore和PaperSpace。这些平台为您提供了一个免费的工作空间,通过添加协作工具来构建您的机器学习产品。在我的日常工作中,我使用Deepnote进行新的研究或项目,如果我需要更好的GPU或TPU,我会切换到Kaggle Orcolab。
您不需要购买昂贵的IDE或计算来构建您的产品。现在您有了这些免费的云工具。
在获得所需的技能后,你开始在市场上找工作,但很快你就意识到公司需要更多。他们希望你了解数据工程、数据分析和MLOPS。在面试阶段,他们会询问你最近的项目和你部署模型的工作经验。
即使在学习了关键的必要技能后,你也会感到相当失望。这是因为大多数公司都在寻找有经验的个人或拥有多种技能的人。你提高机会的唯一方法就是不断学习一项新技能,不断参加机器学习比赛。这也将改善您的ML投资组合,并最终使您脱颖而出。如果你刚开始工作,很难找到工作。继续努力,最终,你会得到你梦寐以求的工作。
正如我上面提到的,它需要擅长各种技能:显然,一个优秀的机器学习工程师所需要的一切,比如好奇心、分析技能、算法知识、理解业务需求的能力,以及有效沟通的需求。还有更多。你需要善于构建需要机器学习操作经验的软件解决方案。Shanif Dhanani的机器学习工程师生活中的一天
除此之外,有时还必须执行迭代任务,如标记数据集。你可能找不到一份高薪的工作,但你最终会得到一份需要你全职和专注的工作。如果你进入这个领域只是因为它提供了一份高薪的工作,那么你应该开始考虑其他的选择。你在职业生涯中取得成功的唯一途径是对人工智能技术有坚定的热爱。
最后,我会一直建议你继续学习新的技能,开始参加Kaggle比赛。为了你的职业生涯,继续寻找新的工作,为你的技术面试做好准备。我只想向你们展示这个领域的实际情况。这并不漂亮,也不是每个人都能度过难关。只有努力工作和学习的心态,你才能找到一个舒适的职位,你有一个高薪的工作。
我们还讨论了机器学习如何不需要大量的数学、专业学位或博士学位。它不需要大量的计算能力或庞大的数据集。它只需要你的时间和努力工作。你可以在网上找到令人惊讶的课程,在学习了一些技能后,开始将这些技能应用到你的投资组合项目中。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26在数字化浪潮下,数据分析已成为企业决策的核心支撑,而CDA数据分析师作为标准化、专业化的数据人才代表,正逐步成为连接数据资 ...
2026-01-26数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21在实际业务数据分析中,单一数据表往往无法满足需求——用户信息存储在用户表、消费记录在订单表、商品详情在商品表,想要挖掘“ ...
2026-01-21在数字化转型浪潮中,企业数据已从“辅助资源”升级为“核心资产”,而高效的数据管理则是释放数据价值的前提。企业数据管理方法 ...
2026-01-21在数字化商业环境中,数据已成为企业优化运营、抢占市场、规避风险的核心资产。但商业数据分析绝非“堆砌数据、生成报表”的简单 ...
2026-01-20定量报告的核心价值是传递数据洞察,但密密麻麻的表格、复杂的计算公式、晦涩的数值罗列,往往让读者望而却步,导致核心信息被淹 ...
2026-01-20在CDA(Certified Data Analyst)数据分析师的工作场景中,“精准分类与回归预测”是高频核心需求——比如预测用户是否流失、判 ...
2026-01-20在建筑工程造价工作中,清单汇总分类是核心环节之一,尤其是针对楼梯、楼梯间这类包含多个分项工程(如混凝土浇筑、钢筋制作、扶 ...
2026-01-19数据清洗是数据分析的“前置必修课”,其核心目标是剔除无效信息、修正错误数据,让原始数据具备准确性、一致性与可用性。在实际 ...
2026-01-19在CDA(Certified Data Analyst)数据分析师的日常工作中,常面临“无标签高维数据难以归类、群体规律模糊”的痛点——比如海量 ...
2026-01-19在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16