京公网安备 11010802034615号
经营许可证编号:京B2-20210330
互联网和移动互联网时代,程序员成了公认的高薪工作,是众多企业的抢手人才。但凡大学专业沾边计算机的理科生,都有机会去竞逐一下互联网大厂的高薪岗位。
数据时代,数据人才就像之前的程序员成了企业的「香饽饽」,互联网大厂又开始招募大量数据岗位,根据《2020中国数字化人才现状与展望》报告显示,数据人才的需求在不断增加:
数据人才的岗位薪资也高于普通白领平均薪资:
面对这么大好的形势,这次难道没咱们文科生什么事情了吗?「我读的文科,我读的商科,我数学不好,我能学数据分析吗?」这也是我们被问的最多的问题之一。
其实文科生已经意识到自己的竞争对手会是数学好的理科生,所以他们的问题细化成两个就是:
· 如果不是计算机或者数学统计相关专业,他就不能做数据分析吗?
· 想转行数据分析师,应该学哪些技能或者编程语言?
我们根据服务过7万学生的经验,总结了三个关键,帮助文科、商科专业的学生成功找到数据好工作:
· 找对求职途径
· 找准就业企业
· 找好学习方法
进入一家公司一般有两种途径——常规的人力资源(HR)途径和内推途径。HR途径就是通过招聘人员、公司招聘网站、招聘系统,或者申请实习来找到工作;而内推途径则是通过招聘经理或者公司的现任员工来推荐申请工作。
HR途径上会根据硬性的专业要求、学历要求进行筛选,可能在你被面试之前,传统的HR途径因为你没有数学统计或计算机学位而剔除你。但在内推途径中,你通常能够直接地与决定是否录用你的人以及最终与你共事的人或团队打交道。
对于那些只拥有市场营销教育背景的求职者来说,获得一份数据科学家工作的最佳途径就是选择内推。
在BOSS直聘上以「数据」为关键词搜索,得到北京地区的前3226个热门岗位,我们可以看到:
3.1 最热门的岗位
数据分析师,是招聘职位里面最热门的,其次是大数据开发工程师、数据产品经理,说明在产品经理领域,数据的应用也是非常广泛。
3.2 薪酬水平
数据相关岗位的薪酬集中在月薪20-50K之间,部分高薪的可以到月薪50-100K,比如BOSS直聘就在北京以80-100K,16薪,招分布式存储计算平台专家,但要求是10年以上的工作经验,不要被这个工作经验吓到,看看接下来的统计。
3.3 工作经验的要求
我们可以看到工作经验的要求还是集中在1-3年,3-5年,其中经验不限的也占了较大比重,所以有志于从事数据行业的,可以大胆的尝试,这个行业很开放,另一个佐证就是下面的学历。
3.4 学历要求
本科是要求最多的,因此担心学历是不是必须要硕士的可以放心,数据告诉你:本科就满足大部分企业的要求。
3.5 招聘企业
从数据来看,在北京对于数据人才需求最大的企业是京东,接下来是滴滴、理想汽车。
3.6 最需要的技能
SQL、Python,数据分析,是这些数据岗位要求最多的技能。这些技能要怎么掌握,学习方法就至关重要了。
并不是所有想往数据方向发展的人都已经从事过数据相关的工作,但每个人都可以将自己曾经做过的数据相关的项目整理到一起,以此来展示自己在数据领域的工作能力。如果你做过一些很不错的项目,并且将它们展示在你的github或简历上,这将大大提高你找到工作的机会。
4.1 如何选择一个好的项目呢?
关于数据项目的选择,最重要的事情之一是它需要是非常有针对性且具有行业独特性。项目内容越具体、越紧密联系某个你感兴趣的行业,你就能越好地解释这个项目的意义。
选择的项目应该符合下列两个类别之一(或者两者都包括):
(1)这个项目是针对你想进入的某个行业或某份工作设计的——做这类项目可以证明你为什么要申请某个特定的职位。这还说明你对可能从事的领域已有了潜在的了解。
(2)这个项目对你来说是有趣的、有热情的——当你面试时,面试官谈论起这段经历,这一点热情就会变得很明显。当候选人对自己做过的项目感到自豪时,面试官是可以明显感受到候选人在被问到该项目时的那份激情的。
4.2 学习数据技能的最佳路径——「以终为始」的项目学习
你选择的项目应该大致遵循以下这样一个流程,并且在做完项目后你需要能够详细地描述当中的每个步骤。
Step 1: 解决一个实际数据问题——以终为始,课程的最后是怎么的项目?项目背景是什么?是出于什么原因要去做这个项目?(商业问题举例:希望通过历史数据评估营销渠道的效果,以此为明年的营销预算分配提供建议)
Step 2: 数据收集——好的项目要有数据收集的过程,既可以是直接从数据源下载数据集,或者是从某个渠道去使用API爬取。(例如使用python从Twitter上获取tweets相关的数据。)
Step 3: 数据清洗和聚合——这一步实在太重要了。没有这一步的项目都不是“贴合实际工作情况“的好项目。它是数据科学中最重要的一步。对数据格式的处理和清洗会对最终分析的结果产生非常大的影响。你需要通过项目去完全了解你在处理数据时做出决策的原因,比如如何处理缺失值,如何选择或提出某些变量特征,以及如何处理异常值等等。(例如某些天因为技术问题,无法收集到营销支出的数据。)
Step 4: 变量探索——这部分对于一个好项目来说也非常重要。因为在这部分分析中,你要去审视每一个变量的特点。你需要深入研究每个变量(或者叫特征)的分布,并评估这些特征之间的关系。为了显示这些关系,你需要使用诸如箱线图、直方图、相关性图等视觉效果。这一过程有助于告诉你哪些变量和数据可以帮助你解答你想要解决的商业问题。(例如显示每天不同渠道的营销费用的分布图,每天的平均花费。)
Step 5: 数据探索性分析——在这一步,你开始利用数据来探索趋势。可以使用数据透视表来了解变量和变量之间随着时间变化而变化的趋势。可视化的工具也应该在这一环节的分析中被大量运用。与前面一步非常相似,这一步也是帮助你来了解在模型中要放入哪些变量。(例如每个品牌每天的销量、营销支出与销售量之间的散点图,等等)
Step 6: 特征工程(或叫变量转换transformation)——这一步的分析非常重要(所以我将其单独列为一步),然而它通常应与数据分析(Step 5)同时进行。特征工程分为两种:
(1)创建可以提高预测准确性的新特征变量;
(2)改变数据的性质,使其更适合进行量化分析。好的项目会教你,在构建新特征变量时如何充分发挥创造性。你可以使用其他数据进行各种形式的组合,把数据的属性从数值转换成类别(或者反过来),亦或是对某一特征变量应用一个变形的函数。(比如,相比直接显示每一天的绝对数值,你可以利用这一天的数据除以一段时间内的平均值,来创造出可以展示相对概念的变量。)
Step 7: 模型的构建和评估——你应该要比较多个模型,以确定哪个模型对于你需要解决的问题能给出最合理的解释和结果。通过使用训练集和测试集对模型进行交叉验证,你可以看出哪一模型对预测结果准确率更高。同时你还应该特别注意如何去评估模型好坏,能够解释为什么你选择这些评估指标。
(例如比较一个随机森林、lasso回归和支持向量机回归模型来预测产品销量。)
Step 8: 将模型结果进行应用(Optional)——如果面试官看到候选人将她的模型投入运用进了一个真实的网页或API,这会让人印象很深刻。这表明候选人可以使用更高级的编程技术或编程包。我个人偏爱使用python,但是我也看到过其他人把R使用得炉火纯青。(例如在你可以创建一个R Shiny Project,通过对预测指标给予不同的假设来预测销量。)
Step 9: 回顾与展示——你需要回顾你做过的项目,看看在项目过程中遇到了哪些困难,通过什么方法解决,哪些地方可以做得更好,并不是所有项目都可以从始到终进行得很完美)这些都将是你在面试中回答行为问题的宝贵素材。我还建议你可以根据当前项目的发现和洞察来思考和开启下一个项目的主题。(例如我应该在这个分析中考虑如何自动化一些比较手动的流程,是否可以找到其他一些指标来提高模型准确率。)
如果你是“非计算机或者数学统计专业背景”的数据岗位求职者,那么就像上文所说的,你应该遵循以下步骤:
· 找对求职途径——找人内推,而不只是给HR投简历。
· 找准就业企业——去有着更多数据的公司,走上你的数据成长之路
· 找好学习方法——去学习一套完整的数据技能,做有针对性的数据项目。
CDA数据分析师按照CDA认证标准打造的《敏捷算法建模训练营》,完全符合一个优秀的项目的9大必备条件!携手全球领先的咨询公司首席数据科学家,真实还原企业常见的数据科学项目,致力于培养优秀的数据科学家!项目经历可放在简历上提升履历背景。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化商业环境中,数据已成为企业优化运营、抢占市场、规避风险的核心资产。但商业数据分析绝非“堆砌数据、生成报表”的简单 ...
2026-01-20定量报告的核心价值是传递数据洞察,但密密麻麻的表格、复杂的计算公式、晦涩的数值罗列,往往让读者望而却步,导致核心信息被淹 ...
2026-01-20在CDA(Certified Data Analyst)数据分析师的工作场景中,“精准分类与回归预测”是高频核心需求——比如预测用户是否流失、判 ...
2026-01-20在建筑工程造价工作中,清单汇总分类是核心环节之一,尤其是针对楼梯、楼梯间这类包含多个分项工程(如混凝土浇筑、钢筋制作、扶 ...
2026-01-19数据清洗是数据分析的“前置必修课”,其核心目标是剔除无效信息、修正错误数据,让原始数据具备准确性、一致性与可用性。在实际 ...
2026-01-19在CDA(Certified Data Analyst)数据分析师的日常工作中,常面临“无标签高维数据难以归类、群体规律模糊”的痛点——比如海量 ...
2026-01-19在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16在游戏行业“存量竞争”的当下,玩家留存率直接决定游戏的生命周期与商业价值。一款游戏即便拥有出色的画面与玩法,若无法精准识 ...
2026-01-16为配合CDA考试中心的 2025 版 CDA Level III 认证新大纲落地,CDA 网校正式推出新大纲更新后的第一套官方模拟题。该模拟题严格遵 ...
2026-01-16在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15在CDA(Certified Data Analyst)数据分析师的日常工作中,“高维数据处理”是高频痛点——比如用户画像包含“浏览次数、停留时 ...
2026-01-15在教育测量与评价领域,百分制考试成绩的分布规律是评估教学效果、优化命题设计的核心依据,而正态分布则是其中最具代表性的分布 ...
2026-01-15在用户从“接触产品”到“完成核心目标”的全链路中,流失是必然存在的——电商用户可能“浏览商品却未下单”,APP新用户可能“ ...
2026-01-14在产品增长的核心指标体系中,次日留存率是当之无愧的“入门级关键指标”——它直接反映用户对产品的首次体验反馈,是判断产品是 ...
2026-01-14在CDA(Certified Data Analyst)数据分析师的业务实操中,“分类预测”是高频核心需求——比如“预测用户是否会购买商品”“判 ...
2026-01-14在数字化时代,用户的每一次操作——无论是电商平台的“浏览-加购-下单”、APP的“登录-点击-留存”,还是金融产品的“注册-实名 ...
2026-01-13在数据驱动决策的时代,“数据质量决定分析价值”已成为行业共识。数据库、日志系统、第三方平台等渠道采集的原始数据,往往存在 ...
2026-01-13在CDA(Certified Data Analyst)数据分析师的核心能力体系中,“通过数据建立模型、实现预测与归因”是进阶关键——比如“预测 ...
2026-01-13在企业数字化转型过程中,业务模型与数据模型是两大核心支撑体系:业务模型承载“业务应该如何运转”的逻辑,数据模型解决“数据 ...
2026-01-12当前手游市场进入存量竞争时代,“拉新难、留存更难”成为行业普遍痛点。对于手游产品而言,用户留存率不仅直接决定产品的生命周 ...
2026-01-12