
在数据分析工作中,你可能经常遇到这样的问题:
从浏览到消费的转化率一直很低,那到底该优化哪里呢?
如果你要投放广告该怎么选择对象人群呢?
遇到类似的问题,我们需要将具体的业务问题和数据之间建立一种关系,然后通过一些分析方法和分析工具,让我们在遇到此类问题时知道:我该选择什么样的分析工具或分析方法去解决实际业务中的问题。
俗话说:没有对比就没有伤害。数据分析的最终目的是对现实的情况或一个功能的好坏做评估,这里最常用的方法就是对比分析法啦。
举个例子来说,2020财年淘宝天猫GMV达成6.589万亿,如果没有对比GMV只是一个数字而已,我们并不知道这个数字代表的业务状况到底如何,业务是增长了呢,还是衰退了呢?如果我们把前三财年的GMV数据也放上,就会发现2020财年的GMV是增长的,从这个对比数据来看业务是稳定上升的。这就是对比分析在数据分析中的作用,没有对比就没有数据结论!
接下来介绍对比分析法中的三个问题:比什么?如何比?跟谁比?
绝对值是本身就具备价值的数字 ,比如:电商平台的销售金额、公众号的阅读数等。当然,如果只看绝对值,是无法得知事情严重到什么程度的。
在具体环境中看比例值才具备对比价值,比如:电商平台的详情页转化率,复购率等。需要注意的是:比例值是一个除法计算,很容易把数量级的一些数字给忽略了,比如说:85除100和85000除100000得到的都是同样的值。
数据对比分析是数据分析岗最常用的方法。
环比是与当前时间范围相邻的上一个时间范围对比。
以下图为例:如果是日环比,则是拿星期二的数据与星期一的数据比,同理,周环比呢,则是拿本周的数据和上一周的数据对比,那月环比自然也是拿本月的数据与上一个月的数据对比了。
环比适合分析短期内具备连续性数据的业务场景。 举个栗子:比如说我们要做一个为期10天促销活动,在做这个活动的过程中,每天都会去观察活动的效果,根据前一天的活动效果来优化后面的活动过程,而这个活动之前没有做过,没法与以前的活动效果进行对比,这个时候就要看日环比数据了。
环比适用于根据相邻时间范围的数字对当前时间范围的指标进行设定。
比如给我们的产品设定每月新增用户为100000,但是第一月我们只做到10000,第二个月只做到12000,那我们就需要跟据前面两月的实际情况进行对比,调整第三个月及之后的目标了。
同比是与当前时间范围上层时间范围的前一范围中同样位置数据对比。
举个栗子:今天是4月16日(当前时间范围),月同比就是选择3月16日来同4月16日进行同比计算。
同比的使用场景有:打赏的流水、销售流水等。像旅行、餐饮、骑行这些会受季节性影响的产品,会拿今年的这个日/月或一个时间段跟去年的同期进行比较。
同比更适合去观察长期的数据集。
举个栗子:公司每年都会进行“双十一”大促,这个时候我们对比数据时可以把今年的同去年的,或者去年同前年的数据进行对比。
同比适用于观察的时间周期里有较多干扰,而我们希望某种程度上消除这些干扰。比如说短视频类的产品,是不是需要考虑工作日和周末以及其他节假日呢。
对比分析法的特点是:可以非常直观地看出事物某方面的变化或差距,并且可以准确、量化地表示出这种变化或差距是多少。
确定对比的对象是数据分析的第一步。
对比的对象可以是自己,也可以是行业。如果是和自己比的话,可以通过某段时间的业务平均值、中位数等统计指标来衡量业务的整体大小;也可以通过变异系数来衡量业务整体的波动;同时也可以使用同比、环比等指标来衡量业务的变化趋势。如果是和行业比较的话,可以通过行业趋势与业务发展趋势进行对比,以判断业务发展是否健康;当然也可以和行业的金标准进行对比,以确定业务发展是否达到行业标准,进而调整业务发展方向和策略!
时间维度:拿昨天跟前天比,拿这个星期跟上个星期比(环比、同比)等等。简单说一下同比的环比的区别,如图片。
不同业务线:跟公司不同的业务线进行对比,比如说做线上汽车交易的,拿新车和二手车比。二手车数据涨跌厉害,那新车有这种情况吗?
往期均值:这里不同于时间维度,像留存、销售额、日活这些都是比较连续的数据,每天都会产生新的指标。但是有很多事情不是连续性的,它不会每天都产生数据,这个时候就要根据往期这些数据的均值进行对比。
结合实际的业务场景,指标上升、下降、持续保持波动没有变化或大幅波动等,都能够称之为某种程度上的问题。
2.和行业比
在实际的业务中,如果跟自己比找不到原因,那么就需要跟行业比,看是自身的原因,还是行业的趋势导致的跌或者涨。
都跌:如果都跌,咱能不能比同行跌得少?
举个栗子:A公司的跌了10%,咱们公司跌了30%,那么在这个相对竞争的环境中,咱跌的是更多的,通过这样的对比,就可以找到原因并解决这个问题。
都涨:如果都涨,咱能不能比同行涨得快?
都涨也是一样的道理,如果A公司涨了30%,咱们只涨了10%,也能找到原因,并给出解决方案。因为如果不这样做,那么相对于竞争对手而言,咱还是在跌的。
2025年,是数据时代的新起点,也是职业探索的新征程。
以上的文章内容来源于柯家媛老师的专栏,如果您想阅读专栏《业务数据分析模型》,点击下方链接
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14