京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据分析基础篇(设计师都应该了解)
当今设计师还不了解数据,自身价值也将会越来越低
第1则- 前言
数据分析是一块知识领域,是一门学科性很强的科目,想要短时间内吃透并不简单,在进入这个领域之前,我们需要学习一些基本的业务常识,结合业务来理解效果会更好。我把数据分析的业务流程整理成一张图帮助大家理解,大致分为「获取数据」、「处理数据」、「数据结果」、「分析原因」、「业务提炼」五大模块。今天着重聊一聊前三个模块,后两个模块会在后面的文段中穿插阐述。
第2则- 数据库的来源
数据库(可以从公司内部的数据库抓取想要的数据)
数据平台(神策,MTA,talkingdata,诸葛io等等,需要接入自身产品)
自建数据平台(大厂或资本较雄厚的公司会有自己的数据平台,另外也有一些开源的可以免费使用,例如「superset」from airbnb)
爬虫(这是最常见的一种方式,需要一定的编程基础。一般来说就是技术人员写代码爬取用户,竞对的数据,相应的,也会有反爬虫技术。)
市场调研(问卷调查,电话访谈,实地调查)
第3则- 方法论
数据分析大致可以分为:数理性分析和营销(管理)性分析。前者相较于后者更加简便,易上手。后者想要做到精通且灵活运用,则需要大量时间与精力浸淫在工作中,用经验来堆砌功力。数理性数据分析主要针对类似新增用户数,日活月活,留存率,转化率,埋点数据等等进行分析,它又分为:常规分析法,统计模型分析法,自建模型分析法。
为了帮助各位系统的学习数据分析,我把这些理论知识用结构图来表示关系。
为了呼应文章的基础性,今天我们就一起来学习「常规分析法」。常规的数据分析法一般都可以分为:趋势分析,对比分析和细分分析。 接下来我们将用「同环比分析法」「ABC分析法」和「漏斗分析法」来对应说明。
同比
拿某个周期的时间段与上一个周期的相同时间段做比较。例如今年的3月比去年的3月,本周的周三比上周的周一等等。同比增长率=(本期数-同期数)/同期数x100%。觉得有点晕?我们来生动的举个栗子:2016年9月新增245个人关注公众号,2017年9份则有586个人数新增,那么公众号新增关注人数的同比增长率=(586-245)/245×100%=1.39183673×100%四舍五入为139%。
环比
相对更简单,就是拿相邻时间段做比较,不像同比那样在相邻时间段内部某个相同时的间点来对比。环比增长率=(本期数-上期数)/上期数×100%。举个栗子,2017年9月本公众号关注人数新增586人,10月则新增172人,那么公众号新增关注人数的环比增长率=(172-586)/586×100%=-0.70648464×100%四舍五入为-71%。
“ABC分析法又称帕雷托分析法,也叫主次因素分析法,是项目管理中常用的一种方法。它是根据事物在技术或经济方面的主要特征,进行分类排队,分清重点和一般,从而有区别地确定管理方式的一种分析方法。由于它把被分析的对象分成A、B、C三类,所以又称为ABC分析法。”
以上摘自百度,翻译成人话来说,以同一指标为业务对象,进行数量、质量、变量等等分析。以该指标各维度数据与总体数据做对比,按照比重多少排序,将各组成部分分为ABC三类。拿最近发生的事举例吧,2017双11期间,全网的总销售额为1770.4亿元。在分析各电商平台销售额数据中,用ABC分析法对各个平台的销售总额做进一步分析,从图中我们得知天猫,京东的销售额对比全网总销售额来说占比非常大,得出这样的结论之后相关品牌方就可以在运营活动中进一步关注这两个平台,重点在这两个平台上做活动推广,宣发,会大概率获得更大的收益。通过合理分配时间,人力,资源成本到获益概率大的目标(A类)上,是通过数据分析得出的战略规划,但是也不能忽略B类C类,他们只是相比A类应得到较少的投入。
所有互联网产品、数据分析都离不开漏斗,无论是注册转化漏斗,还是电商下单的漏斗,需要关注的有两点。第一是关注哪一步流失最多,第二是关注流失的人都有哪些行为。关注注册流程的每一个步骤,可以有效定位高损耗节点。
漏斗分析是一套流程式数据分析,它能够反映用户的某段操作路径的全程及转化情况。通过各相关节点数据对比,直观的发现问题所在,从而进行优化。举个我身边的例子:11月份小说书豆收入环比10月份减少了10%,面对这样一个异常的数据指标,我们很难直接判断出那个环节出了问题,尤其是最近还进行了一次频道首页改版,则更难判断了。
因此,我们可以采用漏斗分析法来确定用户流失路径:用户从进入频道,到阅读书籍,到书豆付费,到离开页面所有的操作步骤罗列出来,从入口到出口把所有的流程整理成一个分析漏斗,针对每个节点采集关键因素数据,分析哪一步操作上出现了异常,再对其进行优化。最后我们发现,由于一个技术bug导致支付页(问题节点)
报错率偏高,许多用户在页面报错后直接离开,因此产生了书豆减少的情况。
两张转化率实例图向我们展示:通常转化率过低的节点就是问题节点。加入购物车之前的转化率都较高,但在购物付款的流程中,转化率急剧降低至8%,这里可能就是需要改进的地方。
类似的分析手法还有很多,以下图中的「同期群分析」、「留存分析」、「热力图分析」、「AB测试」等等都可以归纳到趋势,对比和细分这三种分析种类中,感兴趣的同学可以自行检索,我后期文章中也会详细阐述。
第4则- 小结
「人」这种生物,有时候连自己,都不知道自己想要的是什么,所以有时候很难去窥探用户的心理,数据的分析与挖掘则用相对更科学,概率更大的方法告诉我们他们的真实意图。「数据」很多时候已经替代了用户在屏幕前的“声音”。不管是产品经理,数据分析师,还是用户研究员,大家职能的核心,是通过研究用户/定义产品来创造价值,数据分析只是一件工具,掌握一定的分析手法是必要的,切莫沉迷于手法,并不是手法越高级分析结果越准确,「合适」才最重要。这两天和某度的小伙伴聊天时她说了一点,越往深了追求数据分析的应用,则越容易陷入凡事都要走一套「数分流」的怪圈,好比明明知道人不吃东西就会饿死,非要用各种,人类生命周期,天灾人祸概率,人体代谢机能等等去证明这一点。对此我想说,人是活的,理论是死的,灵活的选择完成目的的手段,能用10块办成的事没有必要花100块。以明确的分析目的为导向,使用最高效且成本最少的分析手段,得出最科学且最正确的分析结果,辅助问题业务的挖掘和优化,才是做数据分析的终极奥义。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06在 CDA(Certified Data Analyst)数据分析师的工作中,“可解释性建模” 与 “业务规则提取” 是核心需求 —— 例如 “预测用户 ...
2025-11-06在分类变量关联分析中(如 “吸烟与肺癌的关系”“性别与疾病发病率的关联”),卡方检验 P 值与 OR 值(比值比,Odds Ratio)是 ...
2025-11-05CDA 数据分析师的核心价值,不在于复杂的模型公式,而在于将数据转化为可落地的商业行动。脱离业务场景的分析只是 “纸上谈兵” ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-05教材入口:https://edu.cda.cn/goods/show/3151 “纲举目张,执本末从。” 若想在数据分析领域有所收获,一套合适的学习教材至 ...
2025-11-04【2025最新版】CDA考试教材:CDA教材一级:商业数据分析(2025)__商业数据分析_cda教材_考试教材 (cdaglobal.com) ...
2025-11-04在数字化时代,数据挖掘不再是实验室里的技术探索,而是驱动商业决策的核心能力 —— 它能从海量数据中挖掘出 “降低成本、提升 ...
2025-11-04在 DDPM(Denoising Diffusion Probabilistic Models)训练过程中,开发者最常困惑的问题莫过于:“我的模型 loss 降到多少才算 ...
2025-11-04在 CDA(Certified Data Analyst)数据分析师的工作中,“无监督样本分组” 是高频需求 —— 例如 “将用户按行为特征分为高价值 ...
2025-11-04当沃尔玛数据分析师首次发现 “啤酒与尿布” 的高频共现规律时,他们揭开了数据挖掘最迷人的面纱 —— 那些隐藏在消费行为背后 ...
2025-11-03这个问题精准切中了配对样本统计检验的核心差异点,理解二者区别是避免统计方法误用的关键。核心结论是:stats.ttest_rel(配对 ...
2025-11-03在 CDA(Certified Data Analyst)数据分析师的工作中,“高维数据的潜在规律挖掘” 是进阶需求 —— 例如用户行为包含 “浏览次 ...
2025-11-03在 MySQL 数据查询中,“按顺序计数” 是高频需求 —— 例如 “统计近 7 天每日订单量”“按用户 ID 顺序展示消费记录”“按产品 ...
2025-10-31在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征 ...
2025-10-31在 CDA(Certified Data Analyst)数据分析师的工作中,“二分类预测” 是高频需求 —— 例如 “预测用户是否会流失”“判断客户 ...
2025-10-31