京公网安备 11010802034615号
经营许可证编号:京B2-20210330
用spss判断正态性检验的几种方法
题目: 某地 120 名男性红细胞数(blood)的数据(见程序中“BEGIN DATA”与“END DATA”之间的数据),此数据呈正态分布吗?(引自马斌荣主编书著,2001. P.150)
syntax 窗口编码如下:
* Ma Bin-Rong: SPSS for Medical Application,2Edit. 2001, P.150:.
DATA LIST FREE /blood.
BEGIN DATA.
568 460 500 580 560 434 561 570 519 645 563 552
540 541 461 501 581 620 573 518 562 597 551 574
480 481 542 462 502 584 517 637 580 547 521 442
564 575 482 543 463 503 585 572 541 525 495 523
634 532 565 483 544 464 504 559 587 494 522 448
526 618 595 577 484 545 558 505 493 586 622 524
456 576 527 490 579 557 546 466 506 572 533 450
566 528 491 567 556 465 485 547 588 507 589 535
596 492 569 555 578 513 530 486 548 534 508 588
628 526 554 531 512 570 514 521 487 459 590 509
END DATA.
NPAR TESTS /K-S(NORMAL)= blood /STATISTICS=DESCRIPTIVES.
DESCRIPTIVES VARIABLES=blood /STATISTICS=ALL.
FREQUENCIES VARIABLES=blood
/STATISTICS=ALL
/HISTOGRAM=NORMAL.
PPLOT /VARIABLES=blood /TYPE=Q-Q.
注: " *````` . " 在syntax中,表示注释的意思.
FREQUENCIES 语句用来描述频次;NPAR TESTS /K-S 语句是k-s检验,检验数据是否符合特定的分布。其中ORAML 表示检验的正态分布。 另:均匀分布是 UNIFORM ;泊松分布是 POISSON ; 指数分布是 EXPONENTIAL ; PPLOT语句生成pp图,检验正态分布与否。
代码执行后,结果如下:
结果分析:
Kolmogorov-Smirnov Test 的结果中, z 值等于0.532,p值等于0.940>0.5,因此数据呈近似正态分布。
Descriptive statics结果中,偏度系数Skewness=-0..33;峰度系数Kurtosis=-0.517;两个系数都小于1,可认为近似于正态分布。
QQ Plot 中,各点近似围绕着直线,说明数据呈近似正态分布。
结果思考:
检验数据的正态性,方法有很多,k-s test,descriptive,qq plot 等方法都可以检验数据的正态性。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27