京公网安备 11010802034615号
经营许可证编号:京B2-20210330
2020年3月,我接到一个电话,通知我将休假,直到另行通知--非正式地意味着我将得到学习的报酬。我知道我在休假期结束后被解雇的可能性很高,因为我没有积极工作的项目。
尽管我在工作中没有做太多关于数据的工作,但一想到不能做任何关于数据的有意义的工作,我就很困扰。尽管如此,我觉得我对下一步可能做什么的选择有限,因为我在工作中没有太多的实际经验。不要误解我,我一直在实习,但在我的时间里,我没有做任何事情来显著(甚至轻微)改善业务(至少在我看来是这样)。我处于一个非常低的位置,缺乏自信,怀疑自己的技能……对我来说,休假不能早点到来。
我做出的第一个具有变革性的决定是致力于成为一名面向未来的、不可抗拒的数据科学家。
当你承诺做某事时,一种来自内心的力量驱使着你。我每天醒来都在想我今天一定比昨天更好,这就是我的动力。然而,在这篇文章中,我将分享我在休假期间做的三件事,以确保我更接近我的目标。
当我解释机器学习中的理论概念时,我很舒服,但我不满意。
每当我在Kaggle上查看人们使用的解决方案时,我总是看到某种形式的提升、套袋或深度学习。提升和装袋,我有很好的理解,但深度学习对我来说是一个禁区。当我意识到这一点时,我决定报名参加Coursera的深度学习专业。
深度学习
从deeplearning.ai中学习深度学习。如果你想闯入人工智能(AI),这种专业化...
在本课程中,我学习了许多基本的深度学习架构和技术,以改进深度学习模型。
我在编程方面已经相当不错了,但每当我听到关于人们如何在这个领域建立职业生涯的播客时,有一件事总是让我感到突出。
推倒重来好获得深刻的理解!
我从来没有从头开始编写机器学习算法,这让我怀疑我是否真的知道发生了什么。
因此,我向自己提出了一个挑战,从头开始编写许多最流行的机器学习算法--对于那些长期关注我的帖子的人来说,你应该知道这是从头开始的算法系列。
算法从头开始-迈向数据科学
阅读《走向数据科学》中关于从头开始算法的写作。共享概念、想法和...的媒体出版物
此外,我认为提高我对关键数据科学框架的技能是很重要的,比如NumPy和Pandas,因此我还创建了Pytrix系列。
Pytrix系列-迈向数据科学
阅读《走向数据科学》中关于Pytrix系列的文章。共享概念、想法和代码的媒体出版物。
我决定把发帖的频率从每周一次增加到每周3次。这个变化迫使我做了两件重要的事情,我认为这对我的成长至关重要:
作为一名数据科学家,不断学习是必不可少的。我们都知道技术发展的有多快,所以要保持敏锐,我们必须磨利我们的斧头。然而,当你学习一个新的话题,意图将这些信息反哺给其他人时,尽管我没有做过这方面的研究,但我发现我以不同的方式吸收信息--我对我正在学习的东西进行更深入的思考,并试图在脑海中想象出来,这一切都有助于使学习成为一个无缝的过程。
最好的数据科学家并不是最聪明的。
软技能在大多数MOOCs都不教,你必须自己出去学习。
成为一名数据科学家的要求,例如知道如何编程、统计学、线性代数、微积分和其他关键的数据概念,往往会让有抱负的数据科学家消耗太多,以至于很容易忘记作为一名数据科学家最重要的部分……能够理解业务想要实现什么,然后使用数据来增加价值。
换句话说,一个好的数据科学家知道很多技术概念,但他们与伟大的数据科学家的区别在于,他们有能力接受一个技术概念,然后简化它,并以一种包容团队所有成员的方式交流它,而不管他们的技术水平如何。
“如果你不能简单地解释它,你就不够了解它”
在我个人看来,每一个数据科学家都是一个个人品牌。维基百科对Entrepreneurship的定义是价值的创造或提取-有效地说,这是作为一名数据科学家的本质。
人们通常只有当他们认为是时候让他们成为一个数据科学的角色时才开始联网,我认为这完全是胡说八道。
在你需要之前建立你的关系网。
在过去的8个月里,构建数据科学网络帮助我改进了5种方法:
协助
有些人在生活中走在你前面,我个人相信宇宙允许我们与这些人相遇,这样他们就可以引导你。让我们面对现实吧,在你的数据科学职业生涯中,你需要寻求帮助!
市场营销
一个强大的网络是一个伟大的试验场的想法。我在我的LinkedIn上进行了多次民意调查,这为我提供了即时反馈。此外,您还可以获得个人推荐。就目前情况来看,我从来没有申请过工作,因为我一直知道口碑的力量,我已经在许多领域利用它为我的优势--无论哪个领域。
向别人学习
你不可能知道数据科学中的所有东西(或者一般的生活),拥有不同的人脉会让你接触到新的东西。经验并不重要,如果你有一个良好的网络,你会学到一些新的东西。
交朋友
如果你问那些在我身边长大的人人工智能是什么,他们可能会用《黑镜》中的一些东西来回答。在这个领域没有朋友可能会很孤独,因为有时你会感到疲倦、没有动力,而你的非数据科学朋友可能无法理解你。与其他数据科学家建立联系会让你意识到你不是世界上唯一一个面临某种挑战的人,当我感到沮丧时,它肯定会让我重新振作起来。
人们知道您必须提供什么
把任何关系粘在一起的胶水都附着在每个人带到桌子上的东西的两边,就是这样。如果人们知道你是做什么的,把你介绍给别人就容易多了--这就是我在8月份获得自由职业的原因。
值得注意的一件关键事情是,我已经在这个领域有了很多接触,这是让我像现在这样进步的原因;我想说,我所做的改变我职业生涯轨迹的最重要的事情是承诺。承诺是一个长期的决定,每天提高自己只有在你的手中。对你的职业生涯负责,是发展你自己的开始。虽然我离我想要的数据科学职业生涯还很远,但我比昨天更近了,比8个月前更近了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在用户从“接触产品”到“完成核心目标”的全链路中,流失是必然存在的——电商用户可能“浏览商品却未下单”,APP新用户可能“ ...
2026-01-14在产品增长的核心指标体系中,次日留存率是当之无愧的“入门级关键指标”——它直接反映用户对产品的首次体验反馈,是判断产品是 ...
2026-01-14在CDA(Certified Data Analyst)数据分析师的业务实操中,“分类预测”是高频核心需求——比如“预测用户是否会购买商品”“判 ...
2026-01-14在数字化时代,用户的每一次操作——无论是电商平台的“浏览-加购-下单”、APP的“登录-点击-留存”,还是金融产品的“注册-实名 ...
2026-01-13在数据驱动决策的时代,“数据质量决定分析价值”已成为行业共识。数据库、日志系统、第三方平台等渠道采集的原始数据,往往存在 ...
2026-01-13在CDA(Certified Data Analyst)数据分析师的核心能力体系中,“通过数据建立模型、实现预测与归因”是进阶关键——比如“预测 ...
2026-01-13在企业数字化转型过程中,业务模型与数据模型是两大核心支撑体系:业务模型承载“业务应该如何运转”的逻辑,数据模型解决“数据 ...
2026-01-12当前手游市场进入存量竞争时代,“拉新难、留存更难”成为行业普遍痛点。对于手游产品而言,用户留存率不仅直接决定产品的生命周 ...
2026-01-12在CDA(Certified Data Analyst)数据分析师的日常工作中,“挖掘变量间的关联关系”是高频核心需求——比如判断“用户停留时长 ...
2026-01-12在存量竞争时代,用户流失率直接影响企业的营收与市场竞争力。无论是电商、互联网服务还是金融行业,提前精准预测潜在流失用户, ...
2026-01-09在量化投资领域,多因子选股是主流的选股策略之一——其核心逻辑是通过挖掘影响股票未来收益的各类因子(如估值、成长、盈利、流 ...
2026-01-09在CDA(Certified Data Analyst)数据分析师的工作场景中,分类型变量的关联分析是高频需求——例如“用户性别与商品偏好是否相 ...
2026-01-09数据库中的历史数据,是企业运营过程中沉淀的核心资产——包含用户行为轨迹、业务交易记录、产品迭代日志、市场活动效果等多维度 ...
2026-01-08在电商行业竞争日趋激烈的当下,数据已成为驱动业务增长的核心引擎。电商公司的数据分析师,不仅是数据的“解读官”,更是业务的 ...
2026-01-08在数据驱动决策的链路中,统计制图是CDA(Certified Data Analyst)数据分析师将抽象数据转化为直观洞察的关键载体。不同于普通 ...
2026-01-08在主成分分析(PCA)的学习与实践中,“主成分载荷矩阵”和“成分矩阵”是两个高频出现但极易混淆的核心概念。两者均是主成分分 ...
2026-01-07在教学管理、学生成绩分析场景中,成绩分布图是直观呈现成绩分布规律的核心工具——通过图表能快速看出成绩集中区间、高分/低分 ...
2026-01-07在数据分析师的工作闭环中,数据探索与统计分析是连接原始数据与业务洞察的关键环节。CDA(Certified Data Analyst)作为具备专 ...
2026-01-07在数据处理与可视化场景中,将Python分析后的结果导出为Excel文件是高频需求。而通过设置单元格颜色,能让Excel中的数据更具层次 ...
2026-01-06在企业运营、业务监控、数据分析等场景中,指标波动是常态——无论是日营收的突然下滑、用户活跃度的骤升,还是产品故障率的异常 ...
2026-01-06