
文科生决心做数据分析师是不是疯了?
背景:
传媒类专业毕业,一直做视频剪辑、编辑方面的工作。没什么编码基础,只在大学时期考过VB。偶然得到一份数据分析师的工作,便决心从零做起。
疑惑:
工作近一年,一直在做数据整理方面工作,感觉没什么分析提炼的能力提升。自学了一点SQL查询语句,统计学与概率教程看不懂理论与具体工作有什么关系。想问我这种情况该从哪方面着手自我修炼呢?
回答:
完全有可能。
题主知不知道有个专业叫心理学,这是一个理科专业,但是是文理兼招的。心理学专业要学很多数据分析,很多文科生也学的很好。
首先破除一个误解,数据分析师最主要的能力不是计算机技术,而是数据统计分析能力。其实小公司里面的数据分析师能力要求并不高,周围的数据分析师很少有高级到懂机器学习的。大家说的懂Java什么的我觉得是数据挖掘工程师了。数据分析和数据挖掘需要掌握的技能有什么区别? – 纪路的回答须知数据分析师到数据挖掘工程师之间还差了100个程序员。下面贴出阿里的“数据分析师职位技能树分析,进阿里什么难度大家懂,所以应聘小公司“数据分析师岗位的话技能要求可适当放低。””校园招聘时一位应聘“数据分析师”职位的学生应该具备哪些技能? – 知乎用户的回答
如果你要入坑数据分析师,我建议你从四方面入门: (根据阿里数据分析师试卷)
1.统计学
2.SQL
3.spss
4.R语言
统计学绝对是数据分析师的核心竞争力,是你技能树的骨干,你要知道过去数据分析也是直接靠人工计算的。但是现在数据量级越来越大,靠手算已经不能解决问题了。所以我们需要一些工具来帮助我们处理数据。比如spss就是一个专门为数据分析开发出来的成品软件,已经非常成熟了。你可能听别人说数据分析师要会spss和SAS,其实呢,他们就相当于PPT和Keynote的关系。工具嘛,会一门就行。对于你这种还没入门的,spss比SAS简单,你可以就学spss不学SAS。那SQL是干什么的呢,它是数据库语言,也就是说数据太多了你要建个仓库把它们分门别类的放好,方便查找。R语言呢,是专门用来统计和制图的一门编程语言,也是数据分析的利器。但是呢,其实spss已经有很多功能了,所以R语言并非必要,只能说是个加分项。
所以只要你统计学的好,spss和SQL也会了,基本上就差不多了。
至于学习难度呢,统计学选外国的教程看起来思路就明晰很多。SQL选对了书一点也不难,spss比SAS简单好多,就是一个直接点的软件,R语言跟你想的不一样,它也跟一般的编程语言不同。不需要多少编程基础,非常适合作为文科生的你。
话不多说,直接推荐入门书籍:
1.统计学:国外的统计学书籍你自己找找,看书做练习题。
2.SQL:《head first SQL》强推,超级简单
3.spss……这个都可以,在网上找找课件
4.R语言:可以从code school上R的入门教程学起,书的话《实战R语言》《R for beginners》《R语言核心技术手册》 入门之后再多分析case,多运用。
还有这个答案,很值得参考如何快速成为数据分析师? – 卡牌大师的回答
但是入门之后,往深里学的话还是要弥补一下自己的数学方面的短板,高数、现代、离散数学(计算机数学)和数据结构(计算机数学)等。尤其离散数字。前期你也许感受不到这个的重要性。可是后期你会越来越感受到。比如你学R语言的xx包,那个包有个论文,然后你看论文发现里面讲了有向图,你就会想这个有向图是个什么鬼。然后你学了离散数学就知道了。数据分析师总之是一个数学和计算机交汇处的职业,所以计算机方面比如网页分析等等也需要涉及一些。这些也并没有你想象的难。我们科班出身的也就是一门学了一学期而已。
然后关于如何入门数据分析师和数据分析师的要求,推荐你翻一翻上关于数据分析师的答案。多看看,然后制定自己的学习计划。关于数据分析、挖掘和R语言的公众号和资源。还有一些博客、统计之都等等可以去看看。
最后,要对自己有信心,有一个idea就去实现它。这是完全可能的。多看书,多刷题,刷到一定数量开始尝试解决实际问题。我有个文科同学就做了一个学期习题期末统计得了我们班最高分 99。现在统计很厉害。
但是我觉得你更应该考虑的是你的职业规划,你学数据分析到底是准备现在就靠这个找工作呢还是把它当做未来的跳板?如果在小公司,数据分析师技能要求并不高,你也许学个几个月就可以去了。可是与之对应,工资也并不高。你不一定愿意。如果去大公司呢,技能要求高,那需要一定的时间。
总之,相信自己,文理科本来就是一个人为的划分而已,大家的脑结构并无显著差异。加油
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
PowerBI 累计曲线制作指南:从 DAX 度量到可视化落地 在业务数据分析中,“累计趋势” 是衡量业务进展的核心视角 —— 无论是 “ ...
2025-08-15Python 函数 return 多个数据:用法、实例与实战技巧 在 Python 编程中,函数是代码复用与逻辑封装的核心载体。多数场景下,我们 ...
2025-08-15CDA 数据分析师:引领商业数据分析体系构建,筑牢企业数据驱动根基 在数字化转型深化的今天,企业对数据的依赖已从 “零散分析” ...
2025-08-15随机森林中特征重要性(Feature Importance)排名解析 在机器学习领域,随机森林因其出色的预测性能和对高维数据的适应性,被广 ...
2025-08-14t 统计量为负数时的分布计算方法与解析 在统计学假设检验中,t 统计量是常用的重要指标,其分布特征直接影响着检验结果的判断。 ...
2025-08-14CDA 数据分析师与业务数据分析步骤 在当今数据驱动的商业世界中,数据分析已成为企业决策和发展的核心驱动力。CDA 数据分析师作 ...
2025-08-14前台流量与后台流量:数据链路中的双重镜像 在商业数据分析体系中,流量数据是洞察用户行为与系统效能的核心依据。前台流量与 ...
2025-08-13商业数据分析体系构建与 CDA 数据分析师的协同赋能 在企业数字化转型的浪潮中,商业数据分析已从 “可选工具” 升级为 “核 ...
2025-08-13解析 CDA 数据分析师:数据时代的价值挖掘者 在数字经济高速发展的今天,数据已成为企业核心资产,而将数据转化为商业价值的 ...
2025-08-13解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-08-12MySQL 统计连续每天数据:从业务需求到技术实现 在数据分析场景中,连续日期的数据统计是衡量业务连续性的重要手段 —— 无论是 ...
2025-08-12PyTorch 中 Shuffle 机制:数据打乱的艺术与实践 在深度学习模型训练过程中,数据的呈现顺序往往对模型性能有着微妙却关键的影响 ...
2025-08-12Pandas 多列条件筛选:从基础语法到实战应用 在数据分析工作中,基于多列条件筛选数据是高频需求。无论是提取满足特定业务规则的 ...
2025-08-12人工智能重塑 CDA 数据分析领域:从工具革新到能力重构 在数字经济浪潮与人工智能技术共振的 2025 年,数据分析行业正经历着前所 ...
2025-08-12游戏流水衰退率:计算方法与实践意义 在游戏行业中,流水(即游戏收入)是衡量一款游戏商业表现的核心指标之一。而游戏流水衰退 ...
2025-08-12CDA 一级:数据分析入门的基石 在当今数据驱动的时代,数据分析能力已成为职场中的一项重要技能。CDA(Certified Data Anal ...
2025-08-12破解游戏用户流失困局:从数据洞察到留存策略 在游戏行业竞争白热化的当下,用户流失率已成为衡量产品健康度的核心指标。一款游 ...
2025-08-11数据时代的黄金入场券:CDA 认证解锁职业新蓝海 一、万亿级市场需求下的数据分析人才缺口 在数字化转型浪潮中,数据已成为企业核 ...
2025-08-11DBeaver 实战:实现两个库表结构同步的高效路径 在数据库管理与开发工作中,保持不同环境(如开发库与生产库、主库与从库)的表 ...
2025-08-08t 检验与卡方检验:数据分析中的两大统计利器 在数据分析领域,统计检验是验证假设、挖掘数据规律的重要手段。其中,t 检验和卡 ...
2025-08-08