【CDA干货】Excel卡方检验完整教程：从零上手，轻松搞定统计显著性检验-CDA数据分析师官网

热线电话：13121318867

首页大数据时代【CDA干货】Excel卡方检验完整教程：从零上手，轻松搞定统计显著性检验

【CDA干货】Excel卡方检验完整教程：从零上手，轻松搞定统计显著性检验

2026-03-31

在日常数据统计、市场调研、学术分析等场景中，我们常常需要判断两个分类变量之间是否存在关联（如性别与消费偏好、产品类型与满意度、疾病与习惯等），而卡方检验（Chi-Square Test）正是解决这类问题的核心统计方法。卡方检验的核心逻辑的是通过对比“实际观测值”与“理论期望值”的偏差程度，判断变量间的关联是否具有统计显著性，无需复杂的公式推导，借助Excel就能快速完成所有操作。

本文将避开复杂的统计理论，聚焦Excel实操，从卡方检验的适用场景、前期准备、分步操作，到结果解读、常见问题排查，全程手把手教学，无论是职场新手、学生还是科研人员，都能跟着步骤完成卡方检验，轻松将统计方法落地到实际工作中。

一、先搞懂：卡方检验在Excel中的核心应用场景

卡方检验主要用于分析两个分类变量的关联性，Excel中常用的卡方检验类型有两种，对应不同的实际需求，新手无需混淆，按需选择即可：

卡方独立性检验（最常用）：判断两个分类变量是否相互独立，比如“性别（男/女）”与“是否购买某产品（是/否）”、“年龄段（青年/中年/老年）”与“对某政策的态度（同意/中立/不同意）”，核心是验证“变量A是否会影响变量B”。
卡方拟合优度检验：判断实际观测数据是否符合预期的理论分布，比如“掷骰子的结果（1-6点）”是否符合均匀分布、“产品不合格率”是否符合预期标准，核心是验证“实际数据与理论假设是否一致”。

本文重点讲解最常用的「卡方独立性检验」，贴合大多数人的实际需求，拟合优度检验将在文末补充简化操作，确保覆盖核心应用场景。

注意：Excel中实现卡方检验的核心工具是「CHITEST函数」，该函数专门计算两个数据集（实际观测值和理论期望值）的卡方分布，用于检验两个分类变量的独立性，其核心原理是：卡方值越大，实际观测值与理论期望值的偏差越大；若两者完全一致，卡方值为0，表明理论值与实际值完全吻合。

二、前期准备：明确数据要求与核心概念

在进行Excel操作前，需先准备符合要求的数据，并理解两个核心概念，避免操作中出现错误，这是卡方检验的基础：

1. 数据要求（关键！避免后续报错）

数据类型：必须是「频数数据」（即计数数据），比如“男性购买产品的人数”“女性不同意某政策的人数”，不能是连续数据（如身高、体重）。
数据格式：需整理成「列联表」（交叉表）形式，行代表一个分类变量，列代表另一个分类变量，表格中每个单元格填写对应类别的频数（实际观测值）。
样本要求：每个单元格的理论期望值（后续计算）建议不小于5，若出现小于5的情况，需扩大样本量，否则检验结果会失真。

2. 核心概念（极简理解，无需深究公式）

实际观测值（Actual Range）：实际统计得到的频数，即列联表中直接填写的数值，是我们收集到的原始数据。
理论期望值（Expected Range）：假设两个变量相互独立时，每个单元格“应该出现”的频数，需通过Excel公式计算得出，核心公式为“某单元格期望值=（对应行总计×对应列总计）÷总样本量”。
P值：卡方检验的核心结果，用于判断关联性的显著性，通常以0.05为临界值（可根据需求调整），P值＜0.05，说明变量间存在显著关联；P值≥0.05，说明变量间无显著关联，无法拒绝“变量独立”的原假设。

三、分步实操：Excel卡方检验（独立性检验）完整流程

本次以「案例」为核心，手把手演示操作，案例场景：调研某产品的购买情况与性别的关联性，收集到以下数据：男性购买25人、不购买20人；女性购买15人、不购买40人，需通过卡方检验判断“性别”与“是否购买产品”是否有关联。

步骤1：整理数据，制作列联表（实际观测值表）

打开Excel，将原始数据整理成列联表，行代表“性别”（男、女），列代表“购买情况”（购买、不购买），同时计算每行总计、每列总计和总样本量，便于后续计算期望值，具体格式如下（可直接复制到Excel中修改）：

性别购买情况	购买	不购买	行总计
男性	25（实际观测值）	20（实际观测值）	45（25+20）
女性	15（实际观测值）	40（实际观测值）	55（15+40）
列总计	40（25+15）	60（20+40）	100（总样本量）

技巧：行总计、列总计可通过Excel求和函数（SUM）快速计算，比如男性行总计=SUM(B2:C2)，购买列总计=SUM(B2:B3)，总样本量=SUM(B4:C4)。

步骤2：计算理论期望值

在Excel中新建一个与实际观测值表结构完全一致的表格，用于填写理论期望值，每个单元格的期望值通过公式计算，核心公式：某单元格期望值 = （该单元格所在行的总计 × 该单元格所在列的总计）÷ 总样本量

结合本次案例，具体计算操作如下：

新建期望值表格，表头与观测值表一致（性别购买情况、购买、不购买、行总计）；
计算“男性-购买”的期望值：单元格输入公式“=B4*D2/D4”（B4是购买列总计，D2是男性行总计，D4是总样本量），按回车得到结果18（40×45÷100=18）；
按照同样的逻辑，计算其他单元格的期望值：
- 男性-不购买：=C4*D2/D4 = 60×45÷100 = 27；
- 女性-购买：=B4*D3/D4 = 40×55÷100 = 22；
- 女性-不购买：=C4*D3/D4 = 60×55÷100 = 33；
期望值表格的行总计、列总计，需与观测值表完全一致（可通过求和验证），确保计算无误，最终期望值表格如下：

性别购买情况	购买	不购买	行总计
男性	18（期望值）	27（期望值）	45
女性	22（期望值）	33（期望值）	55
列总计	40	60	100

注意：CHITEST函数要求实际观测值区域与理论期望值区域的单元格数量完全一致，否则会出现#N/A错误；若期望值为负数，会出现#NUM!错误，若期望值为0，会出现#DIV/0!错误，需检查计算过程或样本数据。

步骤3：使用CHITEST函数计算P值（核心步骤）

Excel的CHITEST函数专门用于计算卡方检验的P值，无需手动计算复杂的卡方公式，只需指定“实际观测值区域”和“理论期望值区域”，即可快速得出结果，函数语法如下： =CHITEST(actual_range, expected_range)

其中，actual_range是实际观测值的单元格区域，expected_range是理论期望值的单元格区域，具体操作如下：

选择一个空白单元格（如B10），作为P值的输出位置；
输入公式：=CHITEST(B2:C3, B7:C8)（B2:C3是实际观测值区域，B7:C8是期望值区域，可根据自己的表格位置调整）；
按回车键，得到P值，本次案例的P值约为0.015（保留三位小数）。

补充：CHITEST函数返回的是卡方检验的单尾概率值，取值范围在0-1之间，直接用于判断关联性即可，无需额外计算卡方统计量（若需查看卡方值，可通过后续补充方法计算）。

步骤4：结果解读（关键！判断变量关联性）

卡方检验的结果解读核心是看P值，结合预设的显著性水平（通常取α=0.05），判断两个变量是否存在显著关联，通用解读规则如下，新手可直接套用：

若P值＜ α（0.05）：拒绝“两个变量相互独立”的原假设，说明两个变量之间存在显著关联；
若P值 ≥ α（0.05）：无法拒绝原假设，说明两个变量之间无显著关联，现有数据无法证明两者存在关联。

结合本次案例：P值≈0.015＜0.05，因此可以得出结论：性别与是否购买该产品存在显著关联，男性购买该产品的概率高于女性（实际观测中，男性购买率25/45≈55.6%，女性购买率15/55≈27.3%）。

补充：若需更严谨的解读，可结合自由度和临界值判断。自由度df=(r-1)(c-1)，其中r是列联表的行数，c是列数，本次案例df=(2-1)(2-1)=1；通过CHISQ.INV.RT函数可计算临界值，输入=CHISQ.INV.RT(0.05,1)，得到临界值3.841；再通过公式计算卡方值（=SUM((实际值-期望值)^2/期望值)），本次案例卡方值≈6.83，大于临界值3.841，进一步验证“变量间存在显著关联”的结论[5]。

四、补充：卡方拟合优度检验（Excel简化操作）

拟合优度检验用于判断实际观测数据是否符合理论分布，比如“掷骰子120次，判断骰子是否均匀”（理论分布：每个点数出现20次），操作流程与独立性检验类似，简化步骤如下：

整理数据：列1填写“类别”（如骰子点数1-6），列2填写“实际观测次数”（如1点出现18次、2点出现22次等），列3填写“理论期望次数”（每个点数20次）；
计算P值：选择空白单元格，输入公式=CHITEST(实际观测次数区域, 理论期望次数区域)；
结果解读：P值＜0.05，说明实际分布与理论分布存在显著差异（骰子不均匀）；P值≥0.05，说明实际分布与理论分布无显著差异（骰子均匀）。

五、Excel卡方检验常见问题与排查方法

新手操作时，容易出现报错或结果失真，以下是最常见的4个问题及排查方法，覆盖绝大多数实操痛点：

问题1：输入CHITEST函数后，出现#N/A错误

原因：实际观测值区域（actual_range）与理论期望值区域（expected_range）的单元格数量不同，或其中一个区域仅包含一个单元格，导致函数无法对比计算[2]。

排查：检查两个区域的行数、列数是否完全一致，比如观测值是2行2列（B2:C3），期望值也必须是2行2列，不能多一行或少一列。

问题2：出现#NUM!或#DIV/0!错误

原因：#NUM!错误是因为期望值区域存在负数；#DIV/0!错误是因为期望值区域存在0，两种情况都会导致函数计算失败。

排查：重新计算期望值，检查行总计、列总计和总样本量的计算是否正确，确保期望值均为正数且不为0；若无法避免期望值小于5，需扩大样本量。

问题3：P值异常（接近0或1），结果不符合常识

原因：1. 实际观测值或期望值填写错误（如把行总计、列总计填到观测值单元格）；2. 函数参数颠倒（把期望值区域填到actual_range，观测值区域填到expected_range）。

排查：重新核对观测值、期望值的填写，确认CHITEST函数的两个参数顺序正确（先观测值，后期望值）。

问题4：检验结果与常识不符（如明明有关联，却得出无关联结论）

原因：1. 样本量过小，导致检验结果不具有代表性；2. 数据不是频数数据（如用百分比代替计数）；3. 期望值小于5的单元格过多。

排查：扩大样本量，确保每个单元格的期望值≥5；将百分比数据转换为频数数据（如“50%的男性购买”，需结合样本量换算成具体人数）。

六、实操技巧：提升Excel卡方检验效率的小细节

快速计算期望值：可利用Excel填充柄，输入第一个单元格的期望值公式后，选中该单元格，拖动填充柄到其他单元格，自动计算所有期望值，无需逐个输入公式。
批量验证数据：通过SUM函数核对观测值、期望值的行总计、列总计，确保两者完全一致，避免计算错误。
灵活调整显著性水平：若需更严格的检验（如学术研究），可将α调整为0.01，此时P值＜0.01才认为存在显著关联；若要求宽松（如日常调研），可将α调整为0.1。
保存模板：将列联表、期望值计算公式、CHITEST函数公式保存为Excel模板，后续进行同类检验时，直接替换数据即可，无需重复操作。

七、总结

Excel卡方检验的核心是“整理列联表→计算期望值→使用CHITEST函数求P值→解读结果”，全程无需复杂的统计公式推导，只要掌握数据格式要求和函数用法，就能快速完成检验，判断两个分类变量的关联性。

新手入门的关键的是：先确保数据是频数数据、列联表格式正确，再准确计算期望值，最后通过P值判断结果——记住“P值＜0.05有显著关联，P值≥0.05无显著关联”的核心规则，就能应对绝大多数实际场景。

无论是职场中的市场调研、用户分析，还是学生的学术论文、科研数据处理，Excel卡方检验都能帮你快速实现统计分析，摆脱“凭感觉判断”的误区，让决策更具数据支撑。多动手实操1-2个案例，就能熟练掌握，赶紧用自己的数据试试吧！

免费加入阅读：https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

期望值数据格式偏差市场调研 D3 交叉表数据统计数据处理

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇CDA数据分析师：决策树分析实战，可解释性建模的核心工具与业务赋能

下一篇【CDA干货】序列模式挖掘在用户行为分析中的应用：从数据轨迹到决策赋能

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

【CDA干货】Excel卡方检验完整教程：从零上手，轻松搞定统计显著性检验

一、先搞懂：卡方检验在Excel中的核心应用场景

二、前期准备：明确数据要求与核心概念

1. 数据要求（关键！避免后续报错）

2. 核心概念（极简理解，无需深究公式）

三、分步实操：Excel卡方检验（独立性检验）完整流程

步骤1：整理数据，制作列联表（实际观测值表）

步骤2：计算理论期望值

步骤3：使用CHITEST函数计算P值（核心步骤）

步骤4：结果解读（关键！判断变量关联性）

四、补充：卡方拟合优度检验（Excel简化操作）

五、Excel卡方检验常见问题与排查方法

问题1：输入CHITEST函数后，出现#N/A错误

问题2：出现#NUM!或#DIV/0!错误

问题3：P值异常（接近0或1），结果不符合常识

问题4：检验结果与常识不符（如明明有关联，却得出无关联结论）

六、实操技巧：提升Excel卡方检验效率的小细节

七、总结

推荐学习书籍 《CDA一级教材》适合CDA一级考生备考，也适合业务及数据分析岗位的从业者提升自我。完整电子版已上线CDA网校，累计已有10万+在读~ !

免费加入阅读：https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA持证人专访：黄冬谈数字化运营核心与数据中台建 ...

【CDA干货】市场调查、竞品分析、需求调研的核心区 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】MySQL分表如何查询数据在哪张表？实战方 ...

【CAD干货】业务模型与逻辑模型的概念辨析及实战案 ...

从“零件”到“引擎”：CDA数据分析师视角下的指标 ...

CDA持证人专访：宋利宝谈电销行业数据运营与数据分 ...

【CDA干货】ARIMA时间序列分析方法：核心原理、建模 ...

从“通用基石”到“场景利器”：CDA数据分析师视角 ...

【CDA干货】SQL Server 提示“实例已在使用”：常见 ...

【CDA干货】Excel数据透视表两列相乘：正确计算方法 ...

从“模糊需求”到“精确标尺”：CDA数据分析师视角 ...

CDA持证人专访：冯卓基谈大数据平台搭建与行业数字 ...

【CDA干货】基于月度数据的送货率提升专项数据分析 ...

从“样本均值”到“总体真相”：CDA数据分析师视角 ...

【CDA干货】指标：量化业务的核心衡量标准与设计指 ...

【CDA干货】Excel透视表计算字段：先乘法后求和汇总 ...

从“杂乱”到“有序”：CDA数据分析师视角下的数据 ...

CDA持证人专访：崔爱军谈地产行业数据治理与数据中 ...

【CDA干货】显著水平与P值的核心区别、关联关系及实 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

推荐学习书籍《CDA一级教材》适合CDA一级考生备考，也适合业务及数据分析岗位的从业者提升自我。完整电子版已上线CDA网校，累计已有10万+在读~ !