如何用SPSS检验多重共线性_多重共线性处理方法-CDA数据分析师官网

热线电话：13121318867

如何用SPSS检验多重共线性_多重共线性处理方法

2017-01-06

如何用SPSS检验多重共线性_多重共线性处理方法

我也在弄这个目前用的STATA的coldiag2的方法
虽然之前用spearman相关系数看了一下没问题
但是coldiag2的条件数200+ = =
现在打算主成分+人工扔掉一些…
不知大家有什么别的方案吗
—————–
多重共线性的后果：
整个回归方程的统计检验P<a，但所有偏回归系数的检验均无统计学意义。
偏回归系数的估计值大小明显与常识不符，甚至连符号都是相反的。比如拟合结果表明累计吸烟量越多，个体的寿命就越长。
在专业知识上可以肯定对应变量有影响的因素，在多元回归分析中却P>a，不能纳入方程
去掉一两个变量或记录，方程的回归系数值发生剧烈抖动，非常不稳定。

多重共线性的确认：
做出自变量间的相关系数矩阵：如果相关系数超过0.9的变量在分析时将会存在共线性问题。在0.8以上可能会有问题。但这种方法只能对共线性作初步的判断，并不全面。
容忍度（Tolerance）:有 Norusis 提出，即以每个自变量作为应变量对其他自变量进行回归分析时得到的残差比例，大小用1减决定系数来表示。该指标越小，则说明该自变量被其余变量预测的越精确，共线性可能就越严重。陈希孺等根据经验得出：如果某个自变量的容忍度小于0.1，则可能存在共线性问题。
方差膨胀因子（Variance inflation factor, VIF）: 由Marquardt于1960年提出，实际上就是容忍度的倒数。
特征根（Eigenvalue）：该方法实际上就是对自变量进行主成分分析，如果相当多维度的特征根等于0，则可能有比较严重的共线性。
条件指数（Condition Idex）：由Stewart等提出，当某些维度的该指标数值大于30时，则能存在共线性。
多重共线性的对策：
增大样本量，可部分的解决共线性问题
采用多种自变量筛选方法相结合的方式，建立一个最优的逐步回归方程。
从专业的角度加以判断，人为的去除在专业上比较次要的，或者缺失值比较多，测量误差比较大的共线性因子。
进行主成分分析，用提取的因子代替原变量进行回归分析。
进行岭回归分析，它可以有效的解决多重共线性问题。
进行通径分析（Path Analysis），它可以对应自变量间的关系加以精细的刻画。Spss可以进行比较基本的通径分析，但复杂的模型需要使用SPSS公司的另外一个软件AMOS来进行。