京公网安备 11010802034615号
经营许可证编号:京B2-20210330
2020年3月,我接到一个电话,通知我将休假,直到另行通知--非正式地意味着我将得到学习的报酬。我知道我在休假期结束后被解雇的可能性很高,因为我没有积极工作的项目。
尽管我在工作中没有做太多关于数据的工作,但一想到不能做任何关于数据的有意义的工作,我就很困扰。尽管如此,我觉得我对下一步可能做什么的选择有限,因为我在工作中没有太多的实际经验。不要误解我,我一直在实习,但在我的时间里,我没有做任何事情来显著(甚至轻微)改善业务(至少在我看来是这样)。我处于一个非常低的位置,缺乏自信,怀疑自己的技能……对我来说,休假不能早点到来。
我做出的第一个具有变革性的决定是致力于成为一名面向未来的、不可抗拒的数据科学家。
当你承诺做某事时,一种来自内心的力量驱使着你。我每天醒来都在想我今天一定比昨天更好,这就是我的动力。然而,在这篇文章中,我将分享我在休假期间做的三件事,以确保我更接近我的目标。
当我解释机器学习中的理论概念时,我很舒服,但我不满意。
每当我在Kaggle上查看人们使用的解决方案时,我总是看到某种形式的提升、套袋或深度学习。提升和装袋,我有很好的理解,但深度学习对我来说是一个禁区。当我意识到这一点时,我决定报名参加Coursera的深度学习专业。
深度学习
从deeplearning.ai中学习深度学习。如果你想闯入人工智能(AI),这种专业化...
在本课程中,我学习了许多基本的深度学习架构和技术,以改进深度学习模型。
我在编程方面已经相当不错了,但每当我听到关于人们如何在这个领域建立职业生涯的播客时,有一件事总是让我感到突出。
推倒重来好获得深刻的理解!
我从来没有从头开始编写机器学习算法,这让我怀疑我是否真的知道发生了什么。
因此,我向自己提出了一个挑战,从头开始编写许多最流行的机器学习算法--对于那些长期关注我的帖子的人来说,你应该知道这是从头开始的算法系列。
算法从头开始-迈向数据科学
阅读《走向数据科学》中关于从头开始算法的写作。共享概念、想法和...的媒体出版物
此外,我认为提高我对关键数据科学框架的技能是很重要的,比如NumPy和Pandas,因此我还创建了Pytrix系列。
Pytrix系列-迈向数据科学
阅读《走向数据科学》中关于Pytrix系列的文章。共享概念、想法和代码的媒体出版物。
我决定把发帖的频率从每周一次增加到每周3次。这个变化迫使我做了两件重要的事情,我认为这对我的成长至关重要:
作为一名数据科学家,不断学习是必不可少的。我们都知道技术发展的有多快,所以要保持敏锐,我们必须磨利我们的斧头。然而,当你学习一个新的话题,意图将这些信息反哺给其他人时,尽管我没有做过这方面的研究,但我发现我以不同的方式吸收信息--我对我正在学习的东西进行更深入的思考,并试图在脑海中想象出来,这一切都有助于使学习成为一个无缝的过程。
最好的数据科学家并不是最聪明的。
软技能在大多数MOOCs都不教,你必须自己出去学习。
成为一名数据科学家的要求,例如知道如何编程、统计学、线性代数、微积分和其他关键的数据概念,往往会让有抱负的数据科学家消耗太多,以至于很容易忘记作为一名数据科学家最重要的部分……能够理解业务想要实现什么,然后使用数据来增加价值。
换句话说,一个好的数据科学家知道很多技术概念,但他们与伟大的数据科学家的区别在于,他们有能力接受一个技术概念,然后简化它,并以一种包容团队所有成员的方式交流它,而不管他们的技术水平如何。
“如果你不能简单地解释它,你就不够了解它”
在我个人看来,每一个数据科学家都是一个个人品牌。维基百科对Entrepreneurship的定义是价值的创造或提取-有效地说,这是作为一名数据科学家的本质。
人们通常只有当他们认为是时候让他们成为一个数据科学的角色时才开始联网,我认为这完全是胡说八道。
在你需要之前建立你的关系网。
在过去的8个月里,构建数据科学网络帮助我改进了5种方法:
协助
有些人在生活中走在你前面,我个人相信宇宙允许我们与这些人相遇,这样他们就可以引导你。让我们面对现实吧,在你的数据科学职业生涯中,你需要寻求帮助!
市场营销
一个强大的网络是一个伟大的试验场的想法。我在我的LinkedIn上进行了多次民意调查,这为我提供了即时反馈。此外,您还可以获得个人推荐。就目前情况来看,我从来没有申请过工作,因为我一直知道口碑的力量,我已经在许多领域利用它为我的优势--无论哪个领域。
向别人学习
你不可能知道数据科学中的所有东西(或者一般的生活),拥有不同的人脉会让你接触到新的东西。经验并不重要,如果你有一个良好的网络,你会学到一些新的东西。
交朋友
如果你问那些在我身边长大的人人工智能是什么,他们可能会用《黑镜》中的一些东西来回答。在这个领域没有朋友可能会很孤独,因为有时你会感到疲倦、没有动力,而你的非数据科学朋友可能无法理解你。与其他数据科学家建立联系会让你意识到你不是世界上唯一一个面临某种挑战的人,当我感到沮丧时,它肯定会让我重新振作起来。
人们知道您必须提供什么
把任何关系粘在一起的胶水都附着在每个人带到桌子上的东西的两边,就是这样。如果人们知道你是做什么的,把你介绍给别人就容易多了--这就是我在8月份获得自由职业的原因。
值得注意的一件关键事情是,我已经在这个领域有了很多接触,这是让我像现在这样进步的原因;我想说,我所做的改变我职业生涯轨迹的最重要的事情是承诺。承诺是一个长期的决定,每天提高自己只有在你的手中。对你的职业生涯负责,是发展你自己的开始。虽然我离我想要的数据科学职业生涯还很远,但我比昨天更近了,比8个月前更近了。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07