SPSS最优尺度:分类主成分分析-CDA数据分析师官网

热线电话：13121318867

SPSS最优尺度:分类主成分分析

2017-11-05

SPSS最优尺度:分类主成分分析

一、分类主成分分析（分析-降维-最优尺度）

1、概念：此过程在减少数据维数的同时量化分类变量。分类主成份分析也表示为缩写词CATPCA（代表categorical principal components analysis）。主成份分析的目标是将初始变量集缩减为表示初始变量中发现的大部分信息的较小不相关主成份集合。当大量变量妨碍有效解释对象（主体和单元）间关系时，该方法最为有用。通过减少维数，您只需解释少量主成份，而不是大量变量。

标准主成份分析假设数值变量间为线性关系。另一方面，通过最优尺度方法，可以将变量调整为不同级别。分类变量在指定维数内得到最优量化。因此，可以为变量间的非线性关系建模。

2、示例。分类主成份分析可用于以图形方式显示工作类别、工作部门、地区、旅行量（高、中、低）和工作满意度之间的关系。您可能会发现两个维占据了大量方差。第一维可能将工作类别与地区分开，而第二维可能将工作部门与旅行量分开。您可能还会发现较高的工作满意度与中等旅行量相关。

3、统计量和图。频率；缺失值；最佳度量水平；众数；按质心坐标、矢量坐标、每变量和每维总计解释的方差；矢量量化变量的成份载荷；类别量化和坐标；迭代历史记录；转换后变量和相关矩阵特征值的相关性；初始变量与相关矩阵特征值的相关性；对象得分；类别图；联合类别图；转换图；残差图；投影质心图；对象图；双标图；三标图和成份载荷图。

4、数据。字符串变量值总是按升序字母数值顺序转换为正整数。用户定义的缺失值、系统缺失值以及小于1的值都视为缺失值；可重新编码值小于1的变量，或者给值小于1的变量加上一个常数，以使其成为非缺失值。

5、假设。数据必须至少包含三个有效个案。该分析基于正整数数据。离散化选项通过将其值分组成具有接近正态分布的类别，将自动分类小数值变量，并且将自动把字符串变量的值转换为正整数。可指定其他离散化方案。

6、相关过程。将所有变量调整为数值级别对应于标准主成份分析。在标准线性主成份分析中使用转换后的变量可获得交替绘图功能。如果所有变量都有多名义尺度级别，则分类主成份分析等同于多重对应分析。如果需要处理的是变量集，则应使用分类（非线性）典型相关性分析。

二、选项（分析-降维-最优尺度-分类主要成分-选项）

1、附加对象。指定要其成为附加对象的对象的个案编号，或者对象范围的第一个和最后一个个案编号，然后单击添加。继续操作，直到指定完所有附加对象。如果将某个对象指定为附加对象，则对于该对象将忽略个案权重。

2、正态化方法。可以指定用于标准化对象得分和变量的五个选项之一。给定分析中只能使用一种正态化方法。

2.1、主要变量。此选项可优化变量之间的关联。对象空间中的变量坐标是成份载入（与主成分的相关性，如维和对象得分）。如果您主要对变量之间的相关性感兴趣，这将非常有用。

2.2、主要对象。此选项可优化对象间的距离。如果您主要对对象之间的区别或相似性感兴趣，这将非常有用。

2.3、对称。如果主要对对象和变量之间的关系感兴趣，则使用此标准化选项。

2.4、独立。如果您想单独检查对象之间的距离和变量之间的相关性，请使用此标准化选项。

2.5、定制。可指定封闭区间[–1, 1]中的任何实数值。值为1等同于“主要对象”方法；值为0等同于“对称”方法；值为–1等同于“主要变量”方法。通过指定大于–1小于1的值，可在对象和变量上分布特征值。此方法对于制作合适的双标图或三标图很有用。

3、标准。可以指定该过程可在其计算中执行的最大迭代次数。还可以选择收敛标准值。如果上两次迭代之间的总拟合之差小于收敛值，或者达到了最大迭代次数，则算法停止迭代。