京公网安备 11010802034615号
经营许可证编号:京B2-20210330
在数据分析中,“累计百分比” 是衡量 “部分与整体关系” 的核心指标 —— 它通过 “逐步累加的占比”,直观呈现数据的分布特征与贡献度,例如 “前 20% 的客户贡献了 80% 的销售额”“前 50% 的产品占据了 90% 的库存”。Tableau 作为专业可视化工具,通过 “表计算” 功能可快速实现累计百分比计算,且支持灵活的维度适配与可视化呈现。
本文将系统讲解 Tableau 累计百分比的计算原理、实操步骤、多场景应用及避坑指南,帮助用户从 “会计算” 到 “会用累计百分比解决业务问题”。
在动手计算前,需先明确累计百分比的本质的业务意义,避免 “为计算而计算”。
累计百分比(Cumulative Percentage)是 “某一维度下,前 N 个数据的累计值占总累计值的比例”,计算公式为:
累计百分比 = (当前行及之前所有行的累计值) / 总累计值 × 100%
示例:某产品类别销售额数据如下,累计百分比计算过程:
| 产品类别 | 销售额(万元) | 累计销售额(万元) | 累计百分比 |
|---|---|---|---|
| 电子产品 | 500 | 500 | 50% |
| 服装 | 300 | 800 | 80% |
| 食品 | 200 | 1000 | 100% |
可见,累计百分比能清晰展示 “各类别对总销售额的累计贡献”—— 电子产品贡献了一半销售额,前两类累计贡献 80%。
累计百分比的价值在于 “快速定位关键影响因素”,典型应用场景包括:
贡献度分析:识别对整体指标影响最大的前 N 个维度(如 “前 10% 的客户贡献了 70% 的收入”);
分布特征判断:验证数据是否符合 “帕累托法则”(20/80 定律),辅助资源倾斜决策;
分层归类:按累计百分比将数据分为 “核心层、重要层、普通层”(如 “累计占比前 20% 为核心客户,20%-50% 为重要客户”);
进度追踪:监控目标完成进度(如 “截至 6 月,累计销售额完成全年目标的 55%”)。
Tableau 中累计百分比通过 “表计算” 实现,核心是 “确定计算维度、排序方式、计算依据”。以下结合 3 种高频场景,详解操作流程(以 “超市销售数据” 为例,含 “产品类别、销售额、地区” 字段)。
适用于 “单一维度下,按某指标排序后的累计占比分析”,步骤如下:
打开 Tableau,连接 “超市销售数据”;
将 “产品类别” 拖到 “行” 功能区,“销售额” 拖到 “列” 功能区;
对 “销售额” 按 “降序” 排序(右键 “产品类别”→“排序”→“按销售额降序”),确保核心贡献维度排在前。
右键 “列” 中的 “销售额”→“添加表计算”;
在表计算窗口中:
选择 “计算类型”→“累计总和”;
选择 “计算依据”→“产品类别”(按产品类别维度累计);
点击 “确定”,此时 “列” 会新增 “销售额(累计总和)” 字段。
点击菜单栏 “分析”→“创建计算字段”,命名为 “累计百分比”;
输入公式(核心:累计销售额 / 总销售额 × 100%):
SUM([销售额]) / TOTAL(SUM([销售额])) * 100
(注:TOTAL()函数用于计算 “总销售额”,默认按视图维度计算总体);
右键 “累计百分比”→“添加表计算”,选择 “计算类型”→“累计总和”,“计算依据”→“产品类别”;
将 “累计百分比” 拖到 “列” 功能区,此时视图会显示 “产品类别 + 销售额 + 累计百分比”。
点击 “累计百分比” 字段,选择 “设置格式”→“数字”→“百分比”,保留 1 位小数;
插入 “参考线”:右键图表→“添加参考线”,选择 “累计百分比” 为参考线,值设为 80%,标注 “帕累托 80% 线”,快速识别核心贡献类别。
适用于 “分层维度下的累计分析”(如 “各地区内,产品类别的销售额累计占比”),核心是 “指定‘分区依据’”,步骤如下:
将 “地区” 拖到 “行” 功能区,“产品类别” 拖到 “行”(放在 “地区” 下方),形成 “地区→产品类别” 的层级结构;
“销售额” 拖到 “列”,按 “销售额降序” 排序。
适用于 “时间维度下的进度追踪”(如 “截至每月,销售额累计完成全年目标的占比”),步骤如下:
将 “订单日期” 拖到 “列”,设置为 “月” 级别(右键 “订单日期”→“月”);
对 “销售额” 添加 “累计总和” 表计算(计算依据 “订单日期”);
创建 “累计完成占比” 计算字段:
[销售额(累计总和)] / [全年目标] * 100;
将 “累计完成占比” 拖到 “列”,即可看到 “每月销售额累计完成全年目标的百分比”(如 “6 月累计完成 50%,12 月累计完成 105%”)。
将 “标记类型” 改为 “条形图”;
“累计完成占比” 拖到 “颜色”,设置 “渐变颜色”(如完成率越高,颜色越深);
添加 “100% 目标线”,直观展示进度是否达标。
Tableau 的表计算功能支持多种自定义设置,可根据业务需求调整计算逻辑,以下为核心技巧:
“计算依据” 决定了 “累计的范围”,Tableau 提供 4 种常见计算依据,需按需选择:
表(向下):按整个视图的所有数据累计(适用于单维度无分组场景);
单元格:按指定维度的顺序累计(最常用,如按产品类别、时间顺序);
自定义:手动选择多个维度组合累计(如 “地区 + 季度” 组合维度)。
累计百分比的结果与数据排序直接相关,需注意:
降序排序:优先展示核心贡献维度(如按销售额降序,突出高贡献产品);
升序排序:展示长尾维度的累计贡献(如按销售额升序,看低贡献产品的累计占比);
时间排序:仅适用于时间序列(按时间升序累计,符合进度追踪逻辑)。
若需分析 “特定子集数据的累计百分比”(如 “2024 年华东地区产品类别的累计占比”),可通过筛选器实现:
添加筛选器(如 “年份 = 2024”“地区 = 华东”);
右键筛选器→“应用于表计算”,确保累计百分比基于筛选后的数据计算(避免用全量数据的总体计算)。
累计百分比的核心价值是 “驱动决策”,以下为 3 个行业实战案例,展示如何用累计百分比解决实际问题。
数据准备:“客户 ID、销售额” 字段,按 “销售额降序” 排序;
计算累计百分比:按 “客户 ID” 累计,得到 “客户销售额累计占比”;
可视化:客户按销售额排名(X 轴),累计百分比(Y 轴),添加 80% 参考线;
结论:前 15% 的客户贡献了 80% 的销售额,将这部分客户定为 “VIP 客户”,重点提供个性化服务;其余 85% 客户按长尾策略运营。
数据准备:“产品 SKU、库存金额、周转天数” 字段,按 “库存金额降序” 排序;
计算累计百分比:按 “产品 SKU” 累计,得到 “库存金额累计占比”;
分析结果:前 10% 的 SKU 库存金额占比 60%,但周转天数达 30 天(远高于平均 15 天);
决策:对这 10% 的 SKU 优化供应链,加快周转;对库存占比低且周转慢的 SKU,考虑清仓处理。
数据准备:“用户 ID、月活跃天数” 字段,按 “活跃天数降序” 排序;
计算累计百分比:按 “用户 ID” 累计,得到 “活跃天数累计占比”;
分层规则:
核心用户:累计占比前 20%(活跃天数≥25 天),推送专属权益;
重要用户:累计占比 20%-50%(活跃天数 15-24 天),推送个性化内容;
普通用户:累计占比 50%-100%(活跃天数<15 天),推送召回活动;
在实际操作中,易因 “表计算设置、数据结构、筛选器应用” 不当导致结果异常,以下为高频问题及解决方案:
原因:“计算依据” 设置错误,未按目标维度累计(如应按 “产品类别” 累计,却选了 “表(向下)”);
解决方案:右键 “累计百分比”→“编辑表计算”,重新选择 “计算依据”(如 “产品类别”),确保累计维度与分析目标一致。
原因:未设置 “分区依据”,导致不同分组的累计数据混合(如 “华东地区” 与 “华北地区” 的产品累计在一起);
原因:筛选器未 “应用于表计算”,累计百分比仍基于筛选前的全量数据计算;
解决方案:右键筛选器→“应用于表计算”,勾选 “累计百分比” 字段,确保筛选后重新计算累计值与总体值。
原因:时间维度未按 “升序” 排序,导致累计逻辑与时间顺序不符(如 1 月累计包含 3 月数据);
解决方案:右键时间字段→“排序”→“升序”,确保累计按时间先后顺序进行。
原因:数据存在重复记录,导致累计总和大于总体值(如同一订单被多次统计);
解决方案:先清理数据(去除重复记录),或在计算时用FIXED函数去重(如FIXED [订单ID]: SUM([销售额])),再计算累计百分比。
原因:未结合 “排名计算”,直接按原始维度累计;
解决方案:
先创建 “客户销售额排名百分比” 计算字段:PERCENT_RANK(SUM([销售额]))(返回 0-1 的排名百分比);
筛选 “排名百分比≤0.2”(前 20% 客户);
计算这部分客户的销售额累计占比,得到 “前 20% 客户的贡献度”。
Tableau 中累计百分比可与 “排名、分组、预测” 等功能结合,深化分析维度:
例如:计算 “前 N 名产品的累计占比”,步骤:
创建 “产品销售额排名” 字段:RANK_DENSE(SUM([销售额]), 'desc');
筛选 “排名≤10”(前 10 名产品);
计算这 10 个产品的销售额累计占比,分析核心产品的贡献度。
例如:按累计百分比将客户分为 “核心、重要、普通” 三组,步骤:
IF [累计百分比] ≤ 20 THEN '核心客户'
ELSEIF [累计百分比] ≤ 50 THEN '重要客户'
ELSE '普通客户'
END
例如:基于历史月度销售额,预测全年销售额累计完成情况,步骤:
对 “月度销售额” 添加 “预测”(右键销售额→“预测”→“显示预测”);
计算 “预测累计销售额” 与 “预测累计完成占比”;
可视化对比 “实际累计占比” 与 “预测累计占比”,及时调整业务策略。
Tableau 累计百分比的计算并不复杂,关键在于 “理解业务需求→正确设置表计算→用可视化呈现决策价值”。无论是识别核心客户、优化库存结构,还是追踪目标进度,累计百分比都能帮助你从 “海量数据” 中快速抓住 “关键少数”,让分析结果更具指导意义。
核心要点回顾:
计算逻辑:累计百分比 = 累计值 / 总累计值 ×100%,依赖 Tableau 表计算实现;
关键设置:“计算依据” 决定累计范围,“排序方式” 影响结果分布,“筛选器应用” 确保数据精准;
业务落地:结合帕累托法则、分层分析、进度追踪,将累计百分比转化为具体决策。
最终,累计百分比的价值不在于 “得到一个百分比数字”,而在于 “通过数字发现业务问题,优化资源分配,提升业务效率”—— 这才是 Tableau 数据分析的核心目标。

数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02