
众所周知,精通Excel不叫精通数据分析,会讲述啤酒与尿不湿的案例并不代表你能洞悉数据,PPT做得漂亮也并不能为你的数据分析能力加分……我们做数据分析是为了能以量化的方式来分析业务问题,并得出结论。其中有两个重点词语: 量化和业务。
量化是为了统一认知,并且确保路径可回溯、可复制。 统一认知后,才能保证不同层级、不同部门的人在平等话语权和同一个方向上进行讨论和协作,才能避免公司内的人以“我感觉”、“我猜测”来判断当前业务的情况。而最终只有解决 业务问题分析才能真正创造价值。
一直以来,不少同事、朋友在问我怎么成为一个数据分析师、数据产品经理?都需要哪些知识储备?今天小亿就来为大家系统的分享一下什么是数据分析师,以及该如何快速、深入的学习这些技能与知识?
—01—
什么是数据分析师?
数据分析师指的是不同行业中,专门从事行业数据搜集、整理、分析、并依据数据做出行业研究、评估和预测的专业人员。
换句话说,数据分析师是一个岗位,只要掌握了数据分析方法和思维,做技术的、做业务的,都可以称为数据分析师, 其工作内容本质上就是从数据中分析出商业价值或者建模发现知识,从而去推动业务,辅助决策。
—02—
数据分析师
如何为企业创造价值?
一个完整的企业数据分析体系涉及到多个环节:采集、清理、转化、存储、可视化、分析决策等等。其中,不同环节工作内容不一样,消耗的时间和产生的价值也相差甚远,如图所示。
比如,互联网企业数据分析体系中至少有三方面的数据:用户行为数据、交易订单数据和CRM数据。工程师把不同来源的数据采集好,然后通过清理、转化等环节统一到数据平台上;再由专门的数据工程师从数据平台上提出数据。这些工作占用了整个环节90%的时间,然而产生的价值却只占10%。
这个金字塔再往上数据分析就和业务实际紧密结合,以报表、可视化等方式支持企业的业务决策,涵盖产品、运营、市场、销售、客户支持各个一线部门。这个部分占用了整个环节才10%的时间,但是却能产生90%的价值。
一个优秀的商业数据分析师应该以价值为导向,紧密结合产品、运营、销售、客户支持等实践,支持各条业务线发现问题、解决问题并创造更多的价值。
—03—
数据分析师常见的种类
都有哪些?
1.数据产品经理
在产品经理的能力基础上,增加数据思维。数据产品经理不仅懂得埋点原理,能够通过抓包等工具抓取数据并进行分析。同时还能够参与数据化产品的制作,如BI报表、CRM系统、AB test试验后台等。
比如老板想搭建一个用户行为监测平台,这时就需要根据老板的需求,转化为详细的技术需求,提给技术去开发,这就是数据产品经理的日常。
2.数据分析师
这就是我们常说的商业化数据分析师,主要负责0-1搭建可视化监控报表,利用数据挖掘和洞察业务,为需求部门提供数据支撑、分析报告、商业化模型等服务,这里面的核心是监控、挖掘、有价值和服务,在公司里担任领导的眼睛与大脑的角色。
3.数据建模师
数据建模师也叫算法工程师,是数理统计知识、编程与业务思维集一身的模型大师,通过建立数学模型、利用算法实现增长,可以说是一家产品的灵魂工作者,比如信息流产品的推荐算法、金融行业的反欺诈和信用评级等。
4.数据工程师
数据工程师的职能更偏向技术工程,主要的工作职责是搭建数据仓库、创建ETL、进行数据治理、数据安全等方面的工作、通过提升运行速度,优化数据结构,更好地服务于数据使用方,比如数据分析师、数据产品经理及数据建模师等。
5.数据科学家
综合性人才,数据分析能力、统计学基础、业务能力、算法与沟通能力集聚一身的人才。包含以上所有的技术与能力。
—04—
成为数据分析师
需要具备哪些能力?
1.业务能力
数据分析最终只有解决业务问题分析才能真正创造价值,即 数据分析师需要具备业务能力,而企业每一项业务本质上是公司整体战略的支撑,因为数据分析师首先要理解了战略,才能选对分析思路的方向。
其次要对自己的行业有足够敏感度,及充分理解行业。即多与业务部门核心团队进行沟通,多关注行业网站,多阅读行业数据分析报告做好积累,比如处于什么阶段,自己所在的位置,当前的重点业务方向在哪里,碰到了哪些挑战,总体的解决思路是什么。
最后还需要具备业务岗位的实战经验,对于业务的理解不是简单的看文档就可以的,一定来自于对于公司业务的实际流程、机制、平台、数据等的充分的理解,最好在实际相关岗位实践过。
2.数据能力
作为数据分析师,首先需要理解企业的数据指标,每个企业企业都有一套KPI指标体系,围绕KPI指标还有一系列的执行监控指标,作为数据分析师一定要对企业的核心指标体系有深入的理解,要能从本质上区分指标的差异,就得对指标的生成过程有透彻的理解,包括从哪个表,哪个字段层层计算汇总而来。
其次要拥有全局的数据视野,即在大多数公司里,数据分析师的工作是专业化的,但其实你分析要的数据是全方位的,不会有划定的专业边界。在实践中,数据分析师往往不知道到底有多少数据,其数据分析的深度和广度由于其视野的狭窄而受限,数据分析师应对数据字典进行系统的学习,自底向上的实践很重要,但自顶向下的学习也很必要。
最后还需要具备了解数据的深度,数据字典体现的往往只是表层的数据含义,如果你希望分析的更为灵活,就需要理解数据之间的依赖关系和来龙去脉,因为每张数据表都是由下一层次的表关联汇总而成,但汇总意味着信息的丢失,只有具备追根溯源的能力,你才更有可能基于更多的信息获得更大的分析自由度,比如看到业务系统上某个菜单的功能,需要对应到系统中的数据是怎样的。
3.技术能力
作为数据分析师,当然还是需要有必要的技能傍身,比如精通SQL、数据库原理、Excel/报表/BI工具技能。除此以外,上下游技术领域,比如数据仓库、数据架构、ETL,需要了解甚至会用,比如:
(1)SQL是最灵活的操作数据的语言,任何一个数据库都会提供SQL的支持,它架起了业务和数据的桥梁,简单易学,性价比很高,也是数据分析师的必须要学习的语言。
(2)EXCEL提供了最为灵活的轻量级数据的加工和呈现的能力,对于EXCEL的掌握是任何数据分析师的基本功,透视图,图表,公式,计算都是极其方便的工具。
(3)BI很大程度上就是用一些可视化技术来进行指标比较的艺术,有助于你更快、更直观的发现问题和定位问题,毕竟人脑对图表、图像的敏感度更高。
(4)数据挖掘技术,比如聚类,分类,预测等等随着机器学习,人工智能工具使用门槛的降低,数据分析师要掌握至少一种挖掘的方法。懂得如何构建模型,尤其是在金融、运营商、互联网、零售等这些数据成熟度较高的行业。
4.沟通能力
对数据分析师来说,沟通能力是非常重要的,因为很多项目需要上层来推动,然后配合的时候需要各业务部门领导去配合你理清需求里数据,执行的时候又需要技术、业务整个链条的配合。
沟通本质还是为了解决问题。明确沟通目的,逻辑清晰的表达,然后站在对方考虑知道对方要什么,沟通也没那么困难。
比如对上沟通,要抓住一切机会去沟通清楚分析的目的到底是什么,领导有什么预期,与此同时,你也需要面对不同的岗位,碰到不同的角色,采用不同的语言,表达你的要求和获得你需要的东西,例如业务如何理解?如何让数据取得更快?发现数据问题如何尽快的确认原因?都考验着你的实际人脉和权威。
除此以外,数据分析师还有一个重要的表达,就是汇报数据分析成果,要学会将问题和分析场景串联起来讲故事,要能通过量化的数字和生动的场景来宣导数据的价值。
—05—
如何快速成为数据分析师?
1.Excel数据分析
每一位数据分析师都脱离不开Excel。它是日常工作中最常用的工具,如果不考虑性能和数据量,它可以应付绝大部分分析工作。虽然现在机器学习如今很常见,Excel依旧是无可争议的第一工具。对于没有经验的你,Excel是一款必须熟练的工具。它是日常工作中最常用的工具,如果不考虑性能和数据量,它可以应付绝大部分分析工作。
2.SQL数据库语言
作为数据分析人员,我们首先要知道如何去获取数据,其中最常见的就是从关系型数据库中取数,因此你可以不会R,不会python,但是你不能不会SQL。
DT时代,数据正在呈指数级增长。Excel对十万条以内的数据处理起来没有问题,但是往小处说,但凡产品有一点规模,数据都是百万起。这时候就需要学习数据库。比如在很多企业的招聘条件中,越来越多的产品和运营岗位,将会SQL作为优先的加分项。SQL是数据分析的核心技能之一,从Excel到SQL是数据处理效率的一大进步。
主要了解数据库查询语言,where,group by,orderby,having,like,count,sum,min,max,distinct,if,join,left join,limit,and和or的逻辑,时间转换函数等。学习SQL最快的方法是能自己下载数据库管理工具,找些数据练习。客户端这里推荐MYSQL。推荐书籍:《MYSQL必知必会》
数据可视化不仅是一门技术,也是一门艺术,同样的数据在不同人的手中,展现出来的效果会千差万别,掌握这门技术会成为职场的加分项。
4.数理统计学
统计学是数据分析最重要的基础之一,是数据分析的基石和方法论。统计知识会要求我们以另一个角度看待数据。当你知道AB两组的差异用平均值看是多傻的事情,你的分析技巧也会显著提高。
这里我们需要从基础的统计理论(描述性统计、区间估计、假设检验等)出发,到基本的统计分析(T 检验、方差分析等),最后到商业常用的模型(回归分析、方差分析等),学习数据分析背后的逻辑,掌握实用统计学的概念和会利用统计的思维去思考问题。推荐书籍:《从零进阶 数据分析的统计基础》-曹正凤、《统计学》-贾俊平
5.数据分析与软件应用
SPSS是统计分析入门软件,如果你想快速入门而又不想学习编程,我推荐使用SPSS。SPSS软件是世界三大统计分析软件之一,以其易于操作、易于入门,结果易于阅读的优点,一直备受数据分析人员的青睐,一般经过短期学习即可用SPSS 做简单的数据分析,包括绘制图表、简单回归、相关分析等等。
学习SPSS的重点并不在于软件本身,而是相关的统计学知识,这也是在前面建议大家铺垫的,也就是你要学会怎样去分析“输入数据后,软件给你呈现的结果”。推荐书籍:《如虎添翼 数据处理的SPSS/SAS EG实现》-徐筱刚、《胸有成竹 数据分析的SPSS/SAS EG进阶》-常国珍、《SPSS统计分析基础教程+高级教程》-张文彤
6.数据分析行业应用和数据分析思维
对于数据分析师来说,业务的了解比数据方法论更重要。当然很遗憾,业务学习没有捷径。 推荐书籍:《增长黑客》《精益数据分析》
—06—
小结
在国内不同层次的数据分析师每天的工作场景都不一样。
基础的数据分析师,每天基本上都是整理数据报表,写sql,查数据。任何一个数据分析师都无法跳过这个阶段,都需要从基层做起。
中层的数据分析师,具备一定独立工作能力,除了做些数据报表工作,会独自承接一些独立问题做专题分析,比如为什么销售会下降、运营现状怎么样,然后搭建一套数据指标体系去描述现状,分析问题。
高级的数据分析师,或者说部门领导/总监,每天基本上都是在开会。管理层的会议、其他业务部门的会议,都会拉上。他们一般都不怎么碰数据,大部分工作就是沟通。当然除了开会以外,也会分析问题,站在高层的角度,梳理决策建议。
但无论处在什么岗位,数据分析只是起点,用数据驱动业务驱动企业管理,做到这个地步才是真正的价值终点。因此大家多去了解业务。看看各部门是如何开展工作的,熟悉业务流程,看看报表,主动思考和发现问题,看观察他们如何将问题转化为具体举措落地的。相信沿着此路线学习,你会在数据分析道路上有所收获。
报名方式
登录CDA认证考试官网注册报名>>点击报名
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10