京公网安备 11010802034615号
经营许可证编号:京B2-20210330
SPSS分析:Bootstrap
一、原理:
非参数统计中一种重要的估计统计量方差进而进行区间估计的统计方法,也称为自助法。其核心思想和基本步骤如下:
1、采用重抽样技术从原始样本中抽取一定数量(自己给定)的样本,此过程允许重复抽样。
2、根据抽出的样本计算给定的统计量T。
3、重复上述N次(一般大于1000),得到N个统计量T。
4、计算上述N个统计量T的样本方差,得到统计量的方差。
应该说Bootstrap是现代统计学较为流行的一种统计方法,在小样本时效果很好。通过方差的估计可以构造置信区间等,其运用范围得到进一步延伸。
具体抽样方法举例:想要知道池塘里面鱼的数量,可以先抽取N条鱼,做上记号,放回池塘。进行重复抽样,抽取M次,每次抽取N条,考察每次抽到的鱼当中有记号的比例,综合M次的比例,在进行统计量的计算。
二、支持的过程
1、频率
◎统计表支持均值、标准差、方差、中位数、偏度、峰度和百分位数的bootstrap估计。◎频率表支持百分比的bootstrap估计。
2、描述性
◎描述统计表支持均值、标准差、方差、偏度和峰度的bootstrap估计。
3、探索
◎描述表支持均值、5%切尾均值、标准差、方差、中位数、偏度、峰度和内距的bootstrap估计。◎M估计量表支持Huber的M估计量、Tukey的双权重、Hampel的M估计量和Andrew的Wave的bootstrap估计。◎百分位数表支持百分位数的bootstrap估计。
4、交叉表
◎定向测量表支持Lambda、Goodman和Kruskal Tau、不定性系数和Somers的d的bootstrap估计。◎对称度量表支持Phi、Cramer的V、列联系数、Kendall的tau-b、Kendall的tau-c、Gamma、Spearman相关性和Pearson的R的bootstrap估计。◎风险评估表支持几率比的bootstrap估计。◎Mantel-Haenszel一般几率比表支持ln(Estimate)的bootstrap估计和显著性检验。
5、均值
◎报告表支持均值、中位数、组内中位数、标准差、方差、峰度、偏度、调和均值和几何均值的bootstrap估计。
6、单样本T检验
◎统计表支持均值和标准差的bootstrap估计。◎检验表支持平均值差值的bootstrap估计和显著性检验。
7、独立样本T检验
◎组统计表支持均值和标准差的bootstrap估计。◎检验表支持平均值差值的bootstrap估计和显著性检验。
8、配对样本T检验
◎统计表支持均值和标准差的bootstrap估计。◎相关性表支持相关性的bootstrap估计。◎检验表支持均值的bootstrap估计。
9、单因素方差分析
◎描述统计表支持均值和标准差的bootstrap估计。◎多重比较表支持平均值差值的bootstrap估计。◎对比检验表支持对比值的bootstrap估计和显著性检验。
10、GLM单变量
◎描述统计表支持均值和标准差的bootstrap估计。◎参数估计值表支持系数、B的bootstrap估计和显著性检验。◎对比结果表支持差值的bootstrap估计和显著性检验。◎估计边际均值:估计值表支持均值的bootstrap估计。◎估计边际均值:成对比较表支持平均值差值的bootstrap估计。◎两两比较检验:多重比较表支持平均值差值的bootstrap估计。
11、双变量相关
◎描述统计表支持均值和标准差的bootstrap估计。◎相关性表支持相关性的bootstrap估计。
12、偏相关
◎描述统计表支持均值和标准差的bootstrap估计。◎相关性表支持相关性的bootstrap估计。
13、线性回归
◎描述统计表支持均值和标准差的bootstrap估计。◎相关性表支持相关性的bootstrap估计。◎模型概要表支持Durbin-Watson的bootstrap估计。◎系数表支持系数、B的bootstrap估计和显著性检验。◎相关系数表支持相关性的bootstrap估计。◎残差统计表支持均值和标准差的bootstrap估计。
14、Ordinal回归
◎参数估计值表支持系数、B的bootstrap估计和显著性检验。
15、判别分析
◎标准化典则判别函数系数表支持标准化系数的bootstrap估计。◎典则判别函数系数表支持非标准化系数的bootstrap估计。◎分类函数系数表支持系数的bootstrap估计。
16、GLM多变量
◎参数估计值表支持系数、B的bootstrap估计和显著性检验。
17、线性混合模型
◎固定效应估计值表支持估计值的bootstrap估计和显著性检验。◎协方差参数估计值表支持估计值的bootstrap估计和显著性检验。
18、Generalized Linear Models
◎参数估计值表支持系数、B的bootstrap估计和显著性检验。
19、Cox回归
◎方程中的变量表支持系数、B的bootstrap估计和显著性检验。
20、二元Logistic回归
◎方程中的变量表支持系数、B的bootstrap估计和显著性检验。
21、多项Logistic回归
◎参数估计值表支持系数、B的bootstrap估计和显著性检验。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16