
深入浅出之数据分析师
今天飞机回程途中,遇到位北海道银行来中国出差的女生;途中聊起了各自的职业;一直聊到北京,全程让我很苦恼的是数据分析、数据分析师这些玩意如何很容易的介绍给她;
比如说她,是银行的一名普通职员,每天的任务是结算、结汇,从早到晚都在跟数据打交道;因为只用整理好的数据,所以自然不在乎也不注意,数据是如何来的;整个总结下来是,用数据的人不知道数据哪里来的,做数据的人不知道数据有什么用处;回忆了下,这还真是一个普遍的现象;
这个问题造成的后果就是,开数据会经常打架,A业务线给出的数据说xx 指标提升了,B业务给出的刚好是另外一种结论,指标在下降;等讨论完毕数据口径,会议结束,大家都感到无力。各人不禁感叹,这个会又白开了;脑袋一拍,目标就来,各种活动方案的目标基本是上拍脑袋,直接10-20倍,各自又忙活一阵子;数据快到我碗里来,昨天要的数据需求好了吗?明天老板开会,给几个数据吧;某某DLU指标掉了,看是不是数据有问题;今天push,明天Push,push ctr嗷嗷的高,同一拨用户群嗷嗷的高,用户投诉还不断;
既然业务上有这么多的问题,数据分析师是具体的解决什么样的问题呢?
Sample:
1.回答发生了什么?频率是多少?为什么会发生?
2.具体的业务问题是什么?
3.现在应该采取什么样的行动?
4.未来的趋势是什么?是否错过了机会?哪些问题(路子)是错误的、正确的,把错误的去掉,只留下正确的;
数据只有结合了业务才是有价值的,数据体现可以用四个字词概括,看数据、用数据、依赖数据、数据变现。稍微详细解释如下:
看数据, 能然让业务准确、及时、完整的看到数据, 落地是在报表、取数等;
用数据, 业务上通过数据做出决策 ,落地是异常监控/专题分析;
依赖数据,数据嵌入到业务的日常流程中,通过数据挖掘高价值信息推进业务,落地点在数据产品,数据挖掘产品;
数据变现,利用数据来赚钱了,落地点可在外部数据平台,数据产品上;
在这整个环节中”数据分析师“是做什么呢?我们从分析师的日常工作来分析看,临时需求、报表、数据分析与模型、数据产品,数据挖掘这几个角度来聊一下;
临时需求不必说了,就是解决业务的一次性,临时的数据需求;报表呢,是根据业务的需要,对于常规且定期查看与分析的数据,形成report;
数据分析与模型,与业务一起沟通,分析业务上的各种问题,提供一些业务上的建议与取舍,根据业务需要搞一些挖掘模型等;
数据产品,是通过可视化的方式解决一些结构化(固化)业务问题;把数据分析模型、分析思路与数据结合、面向定向业务提供分析产品;
数据挖掘,数据直接作用到业务上,比如作弊用户、标签推荐、用户行为的定向引导;
以上列举的这几类,前两类是实现看数据的,后三类是挖掘数据价值的;
数据分析师在工作时,在寻求答案的过程中,有一个很重要的衔接点,就是思考。
很多时候,分析师会受到固有问题的影响,如果不去变通,不懂得如何去提炼核心的话,就会产生思考的盲点,就注定问不出一些非常关键的问题;有时答案不重要,思考的角度才是很重要;比如在搞临时需求时,不要把临时需求当成一个取数的工作,学会梳理,学会管理;通过思考,可以发现很多业务上的问题; 了解业务,熟悉业务流程,总结与沉淀自己对业务的理解,知道行业的发展,才能提高自己。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26