京公网安备 11010802034615号
经营许可证编号:京B2-20210330
SPSS数据分析—多维尺度分析
在市场研究中,有一种分析是研究消费者态度或偏好,收集的数据是某些对象的评分数据,这些评分数据可以看做是对象间相似性或差异性的表现,也就是一种距离,距离近的差异性小,距离远的差异性大。而我们的分析目的也是想查看这些对象间的差异性或相似性情况,此时由于数据的组成形式不一样,因此不能使用对应分析,而需要使用一种专门分析此问题的方法——多维尺度分析(MDS模型)。多维尺度分析和对应分析类似,也是通过可视化的图形阐述结果,并且也是一种描述性、探索性数据分析方法。
基于以上,我们可以得知,多维尺度分析经常使用在市场研究中:
① 可以确定空间的维数(变量、指标),以反映消费者对不同品牌的认知,并且在由这些维构筑的空间中,标明某关注品牌和消费者心目中理想品牌的位置,选择的品牌不宜过少也不宜过多,一般7-9个。
② 可以比较消费者和非消费者对企业形象的感觉。
③ 在进行市场细分时,可以在同一空间对品牌和消费者定位,然后把具有相似感觉的消费者分组、归类。
④ 在新产品开发方面,通过在空间图上寻找间隙,可以发现由这些间隙为企业带来的潜在契机。
⑤ 在广告效果的评估方面,可以用空间图去判定一个广告是否成功地实现了期望的品牌定位。
⑥ 在价格策略方面,通过比较加入与不加入价格轴的空间图,可以推断价格的影响强度。
⑦ 在分销渠道策略方面,利用空间图可以判断品牌对不同零售渠道的适应性,从而为制定有效的分销渠道提供依据。
在市场研究中,我们要注意的是选择的品牌数量要适中,并且分析的问题要明确,每组数据只能分析一个问题,比如对一组饮料产品收集的数据不能既反映口感又反映价格。
多维尺度分析收集的数据值大小必须能够反应两个研究对象的相似性或差异性程度。这种数据叫做邻近数据,所有研究对象的邻近数据可以用一个邻近矩阵表示。反映邻近的测量方式有:
相似性-数值越大对应着研究对象越相似。 差异性-数值越大对应着研究对象越不相似。
测量邻近性数据的类型有:
①两个地点(位置)之间的实际距离。(测量差异性)
②两个产品之间相似性或差异性的消费者心理测量。(差异性或相似性)
③两个变量的相关性测量。(相关系数测量相似性)
④从一个对象过渡到另一个对象的转换概率。例如概率反应了消费者对品牌或产品偏好的变化。(测量相似性)
⑤反映两种事物在一起的程度。例如:用早餐时人们经常将哪两种食品搭配在一起。(测量相似性)
⑥谁喜欢谁,谁是谁的领导,谁传递给谁信息,谁是谁的上游或下游等等社会网络数据等(测量相似性)
邻近数据即可以直接测量(距离),也可以通过计算得到(变量间的相关系数)。
多维尺度模型根据测量的尺度不同可以分为:
①古典MDS模型,针对收集的数据为比率和区间,也就是直接可以测量距离的情况
②非度量MDS模型,收集的数据为有序数据,针对无法直接测量距离,只能通过评分测量的情况
根据测量的个体数量不同,可以分为
①不考虑个体差异的MDS模型(ALSCAL),即单个测量个体
②考虑个体差异的MDS模型(INDSCAL),即多个测量个体
这里说的测量个体并不是选取的测量指标,而是实际测量的个体,相当于样本。
由于多维尺度分析是用来分析差异性或相似性的,也带有度量的含义,因此在SPSS中也将其归在了度量过程中。共有三个过程,下面我们来分别介绍
一、不考虑个体差异的MDS模型
本案例进行的是最基本的多维尺度分析,目的是分析每个城市的距离情况,只有一个个体,并且收集的数据直接是距离数据,因此采用古典MDS模型,数据组成如下
分析—度量—多维尺度(ALSCAL)
二、考虑个体差异的MDS模型
实际分析中,我们往往不会只选取一个样本,比如受访者肯定不止一个,那么收集上来的数据会变成多个矩阵,如果将其浓缩为一个矩阵会损失大量数据信息,而直接使用重复多维尺度模型当然也是可以的,但是该方法没有考虑个体间差异,因此并非最佳选择。而考虑个体差异的MDS模型不仅分析对象间的结构,而且会进一步分析对象间的差异。
本例中识10位受访者对10种饮料的口感差异性评分,分值越大差异越大,10位受访者的数据形成了10个数据阵,数据如下
下面我们选用考虑个体差异的MDS模型进行分析
三、基于最优尺度变换的MDS模型
将最优尺度变换引入MDS模型式对传统MDS模型的拓展,我们来看使用最优尺度变换的MDS模型再来分析一下饮料的数据
分析—度量—多维尺度(PROXSCAL)
四、多维展开模型
以上的MDS模型不管是传统MDS还是非度量MDS,都是要求各对象间不存在分组,分析时是直接考虑各对象两两间的距离远近。但是实际问题中,可能会遇到对象被分为两组,我们是想考察这多个组之间的相似性或差异性,而对组内对象间的距离远近并不关心,这时传统的MDS模型就不再适合,而需要采用多维展开模型进行分析。
看一个例子,现在收集了两组变量,一组是场景,共15个水平,另一组是行为,共15个水平。现在想分析这两组变量间的差异性或相似性,数据如下

我们用多维展开模型进行分析
分析—度量—多维展开(PREFSCAL)

接下来会分别输出行列变量的坐标,以及行列变量在二维分布图,但是我们实际上更关心的是行列变量的联合分布图
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02