京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据分析基础篇(设计师都应该了解)
当今设计师还不了解数据,自身价值也将会越来越低
第1则- 前言
数据分析是一块知识领域,是一门学科性很强的科目,想要短时间内吃透并不简单,在进入这个领域之前,我们需要学习一些基本的业务常识,结合业务来理解效果会更好。我把数据分析的业务流程整理成一张图帮助大家理解,大致分为「获取数据」、「处理数据」、「数据结果」、「分析原因」、「业务提炼」五大模块。今天着重聊一聊前三个模块,后两个模块会在后面的文段中穿插阐述。
第2则- 数据库的来源
数据库(可以从公司内部的数据库抓取想要的数据)
数据平台(神策,MTA,talkingdata,诸葛io等等,需要接入自身产品)
自建数据平台(大厂或资本较雄厚的公司会有自己的数据平台,另外也有一些开源的可以免费使用,例如「superset」from airbnb)
爬虫(这是最常见的一种方式,需要一定的编程基础。一般来说就是技术人员写代码爬取用户,竞对的数据,相应的,也会有反爬虫技术。)
市场调研(问卷调查,电话访谈,实地调查)
第3则- 方法论
数据分析大致可以分为:数理性分析和营销(管理)性分析。前者相较于后者更加简便,易上手。后者想要做到精通且灵活运用,则需要大量时间与精力浸淫在工作中,用经验来堆砌功力。数理性数据分析主要针对类似新增用户数,日活月活,留存率,转化率,埋点数据等等进行分析,它又分为:常规分析法,统计模型分析法,自建模型分析法。
为了帮助各位系统的学习数据分析,我把这些理论知识用结构图来表示关系。
为了呼应文章的基础性,今天我们就一起来学习「常规分析法」。常规的数据分析法一般都可以分为:趋势分析,对比分析和细分分析。 接下来我们将用「同环比分析法」「ABC分析法」和「漏斗分析法」来对应说明。
同比
拿某个周期的时间段与上一个周期的相同时间段做比较。例如今年的3月比去年的3月,本周的周三比上周的周一等等。同比增长率=(本期数-同期数)/同期数x100%。觉得有点晕?我们来生动的举个栗子:2016年9月新增245个人关注公众号,2017年9份则有586个人数新增,那么公众号新增关注人数的同比增长率=(586-245)/245×100%=1.39183673×100%四舍五入为139%。
环比
相对更简单,就是拿相邻时间段做比较,不像同比那样在相邻时间段内部某个相同时的间点来对比。环比增长率=(本期数-上期数)/上期数×100%。举个栗子,2017年9月本公众号关注人数新增586人,10月则新增172人,那么公众号新增关注人数的环比增长率=(172-586)/586×100%=-0.70648464×100%四舍五入为-71%。
“ABC分析法又称帕雷托分析法,也叫主次因素分析法,是项目管理中常用的一种方法。它是根据事物在技术或经济方面的主要特征,进行分类排队,分清重点和一般,从而有区别地确定管理方式的一种分析方法。由于它把被分析的对象分成A、B、C三类,所以又称为ABC分析法。”
以上摘自百度,翻译成人话来说,以同一指标为业务对象,进行数量、质量、变量等等分析。以该指标各维度数据与总体数据做对比,按照比重多少排序,将各组成部分分为ABC三类。拿最近发生的事举例吧,2017双11期间,全网的总销售额为1770.4亿元。在分析各电商平台销售额数据中,用ABC分析法对各个平台的销售总额做进一步分析,从图中我们得知天猫,京东的销售额对比全网总销售额来说占比非常大,得出这样的结论之后相关品牌方就可以在运营活动中进一步关注这两个平台,重点在这两个平台上做活动推广,宣发,会大概率获得更大的收益。通过合理分配时间,人力,资源成本到获益概率大的目标(A类)上,是通过数据分析得出的战略规划,但是也不能忽略B类C类,他们只是相比A类应得到较少的投入。
所有互联网产品、数据分析都离不开漏斗,无论是注册转化漏斗,还是电商下单的漏斗,需要关注的有两点。第一是关注哪一步流失最多,第二是关注流失的人都有哪些行为。关注注册流程的每一个步骤,可以有效定位高损耗节点。
漏斗分析是一套流程式数据分析,它能够反映用户的某段操作路径的全程及转化情况。通过各相关节点数据对比,直观的发现问题所在,从而进行优化。举个我身边的例子:11月份小说书豆收入环比10月份减少了10%,面对这样一个异常的数据指标,我们很难直接判断出那个环节出了问题,尤其是最近还进行了一次频道首页改版,则更难判断了。
因此,我们可以采用漏斗分析法来确定用户流失路径:用户从进入频道,到阅读书籍,到书豆付费,到离开页面所有的操作步骤罗列出来,从入口到出口把所有的流程整理成一个分析漏斗,针对每个节点采集关键因素数据,分析哪一步操作上出现了异常,再对其进行优化。最后我们发现,由于一个技术bug导致支付页(问题节点)
报错率偏高,许多用户在页面报错后直接离开,因此产生了书豆减少的情况。
两张转化率实例图向我们展示:通常转化率过低的节点就是问题节点。加入购物车之前的转化率都较高,但在购物付款的流程中,转化率急剧降低至8%,这里可能就是需要改进的地方。
类似的分析手法还有很多,以下图中的「同期群分析」、「留存分析」、「热力图分析」、「AB测试」等等都可以归纳到趋势,对比和细分这三种分析种类中,感兴趣的同学可以自行检索,我后期文章中也会详细阐述。
第4则- 小结
「人」这种生物,有时候连自己,都不知道自己想要的是什么,所以有时候很难去窥探用户的心理,数据的分析与挖掘则用相对更科学,概率更大的方法告诉我们他们的真实意图。「数据」很多时候已经替代了用户在屏幕前的“声音”。不管是产品经理,数据分析师,还是用户研究员,大家职能的核心,是通过研究用户/定义产品来创造价值,数据分析只是一件工具,掌握一定的分析手法是必要的,切莫沉迷于手法,并不是手法越高级分析结果越准确,「合适」才最重要。这两天和某度的小伙伴聊天时她说了一点,越往深了追求数据分析的应用,则越容易陷入凡事都要走一套「数分流」的怪圈,好比明明知道人不吃东西就会饿死,非要用各种,人类生命周期,天灾人祸概率,人体代谢机能等等去证明这一点。对此我想说,人是活的,理论是死的,灵活的选择完成目的的手段,能用10块办成的事没有必要花100块。以明确的分析目的为导向,使用最高效且成本最少的分析手段,得出最科学且最正确的分析结果,辅助问题业务的挖掘和优化,才是做数据分析的终极奥义。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-10在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-10在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01