
数据分析基础篇(设计师都应该了解)
当今设计师还不了解数据,自身价值也将会越来越低
第1则- 前言
数据分析是一块知识领域,是一门学科性很强的科目,想要短时间内吃透并不简单,在进入这个领域之前,我们需要学习一些基本的业务常识,结合业务来理解效果会更好。我把数据分析的业务流程整理成一张图帮助大家理解,大致分为「获取数据」、「处理数据」、「数据结果」、「分析原因」、「业务提炼」五大模块。今天着重聊一聊前三个模块,后两个模块会在后面的文段中穿插阐述。
第2则- 数据库的来源
数据库(可以从公司内部的数据库抓取想要的数据)
数据平台(神策,MTA,talkingdata,诸葛io等等,需要接入自身产品)
自建数据平台(大厂或资本较雄厚的公司会有自己的数据平台,另外也有一些开源的可以免费使用,例如「superset」from airbnb)
爬虫(这是最常见的一种方式,需要一定的编程基础。一般来说就是技术人员写代码爬取用户,竞对的数据,相应的,也会有反爬虫技术。)
市场调研(问卷调查,电话访谈,实地调查)
第3则- 方法论
数据分析大致可以分为:数理性分析和营销(管理)性分析。前者相较于后者更加简便,易上手。后者想要做到精通且灵活运用,则需要大量时间与精力浸淫在工作中,用经验来堆砌功力。数理性数据分析主要针对类似新增用户数,日活月活,留存率,转化率,埋点数据等等进行分析,它又分为:常规分析法,统计模型分析法,自建模型分析法。
为了帮助各位系统的学习数据分析,我把这些理论知识用结构图来表示关系。
为了呼应文章的基础性,今天我们就一起来学习「常规分析法」。常规的数据分析法一般都可以分为:趋势分析,对比分析和细分分析。 接下来我们将用「同环比分析法」「ABC分析法」和「漏斗分析法」来对应说明。
同比
拿某个周期的时间段与上一个周期的相同时间段做比较。例如今年的3月比去年的3月,本周的周三比上周的周一等等。同比增长率=(本期数-同期数)/同期数x100%。觉得有点晕?我们来生动的举个栗子:2016年9月新增245个人关注公众号,2017年9份则有586个人数新增,那么公众号新增关注人数的同比增长率=(586-245)/245×100%=1.39183673×100%四舍五入为139%。
环比
相对更简单,就是拿相邻时间段做比较,不像同比那样在相邻时间段内部某个相同时的间点来对比。环比增长率=(本期数-上期数)/上期数×100%。举个栗子,2017年9月本公众号关注人数新增586人,10月则新增172人,那么公众号新增关注人数的环比增长率=(172-586)/586×100%=-0.70648464×100%四舍五入为-71%。
“ABC分析法又称帕雷托分析法,也叫主次因素分析法,是项目管理中常用的一种方法。它是根据事物在技术或经济方面的主要特征,进行分类排队,分清重点和一般,从而有区别地确定管理方式的一种分析方法。由于它把被分析的对象分成A、B、C三类,所以又称为ABC分析法。”
以上摘自百度,翻译成人话来说,以同一指标为业务对象,进行数量、质量、变量等等分析。以该指标各维度数据与总体数据做对比,按照比重多少排序,将各组成部分分为ABC三类。拿最近发生的事举例吧,2017双11期间,全网的总销售额为1770.4亿元。在分析各电商平台销售额数据中,用ABC分析法对各个平台的销售总额做进一步分析,从图中我们得知天猫,京东的销售额对比全网总销售额来说占比非常大,得出这样的结论之后相关品牌方就可以在运营活动中进一步关注这两个平台,重点在这两个平台上做活动推广,宣发,会大概率获得更大的收益。通过合理分配时间,人力,资源成本到获益概率大的目标(A类)上,是通过数据分析得出的战略规划,但是也不能忽略B类C类,他们只是相比A类应得到较少的投入。
所有互联网产品、数据分析都离不开漏斗,无论是注册转化漏斗,还是电商下单的漏斗,需要关注的有两点。第一是关注哪一步流失最多,第二是关注流失的人都有哪些行为。关注注册流程的每一个步骤,可以有效定位高损耗节点。
漏斗分析是一套流程式数据分析,它能够反映用户的某段操作路径的全程及转化情况。通过各相关节点数据对比,直观的发现问题所在,从而进行优化。举个我身边的例子:11月份小说书豆收入环比10月份减少了10%,面对这样一个异常的数据指标,我们很难直接判断出那个环节出了问题,尤其是最近还进行了一次频道首页改版,则更难判断了。
因此,我们可以采用漏斗分析法来确定用户流失路径:用户从进入频道,到阅读书籍,到书豆付费,到离开页面所有的操作步骤罗列出来,从入口到出口把所有的流程整理成一个分析漏斗,针对每个节点采集关键因素数据,分析哪一步操作上出现了异常,再对其进行优化。最后我们发现,由于一个技术bug导致支付页(问题节点)
报错率偏高,许多用户在页面报错后直接离开,因此产生了书豆减少的情况。
两张转化率实例图向我们展示:通常转化率过低的节点就是问题节点。加入购物车之前的转化率都较高,但在购物付款的流程中,转化率急剧降低至8%,这里可能就是需要改进的地方。
类似的分析手法还有很多,以下图中的「同期群分析」、「留存分析」、「热力图分析」、「AB测试」等等都可以归纳到趋势,对比和细分这三种分析种类中,感兴趣的同学可以自行检索,我后期文章中也会详细阐述。
第4则- 小结
「人」这种生物,有时候连自己,都不知道自己想要的是什么,所以有时候很难去窥探用户的心理,数据的分析与挖掘则用相对更科学,概率更大的方法告诉我们他们的真实意图。「数据」很多时候已经替代了用户在屏幕前的“声音”。不管是产品经理,数据分析师,还是用户研究员,大家职能的核心,是通过研究用户/定义产品来创造价值,数据分析只是一件工具,掌握一定的分析手法是必要的,切莫沉迷于手法,并不是手法越高级分析结果越准确,「合适」才最重要。这两天和某度的小伙伴聊天时她说了一点,越往深了追求数据分析的应用,则越容易陷入凡事都要走一套「数分流」的怪圈,好比明明知道人不吃东西就会饿死,非要用各种,人类生命周期,天灾人祸概率,人体代谢机能等等去证明这一点。对此我想说,人是活的,理论是死的,灵活的选择完成目的的手段,能用10块办成的事没有必要花100块。以明确的分析目的为导向,使用最高效且成本最少的分析手段,得出最科学且最正确的分析结果,辅助问题业务的挖掘和优化,才是做数据分析的终极奥义。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04