京公网安备 11010802034615号
经营许可证编号:京B2-20210330
SAS市场研究应用介绍:离散选择分析
一、离散选择分析(discrete choice analysis)介绍
联合分析是用来发掘消费者的偏好,指出了消费者将选择购买哪种组合(联合分析相关内容具体请参考上一文章介绍:SAS市场研究应用介绍:组合/联合分析)。在市场研究中,消费者实际做的选择是一种利益行为,那么用离散选择分析方法来直接分析消费者的选择是明智的,即离散选择法的目标是通过(特定个体的或者特定类别的)协变量解释所观察到的在离散对象中进行的抉择。
离散选择分析(模型),也叫做基于选择的结合分析模型(Choice-Based Conjoint Analysis),是一种非常有效且实用的技术,也是SAS市场研究模块中常用的一种技术方法。该模型是在实验设计的基础上,通过模拟所要研究产品/服务的市场竞争环境,来测量消费者的购买行为,从而获知消费者如何在不同产品/服务属性水平和价格条件下进行选择。这种技术可广泛应用于新产品开发、市场占有率分析、品牌竞争分析、市场细分和价格策略等市场营销领域。同时离散选择分析/模型也是一种处理离散的、非线性的定性数据的复杂高级多元统计分析技术,它采用Multinomial Logit Model进行数据分析。
二、离散选择分析/模型的基本概念和原理
离散选择模型主要用于测量消费者在实际或模拟的市场竞争环境下如何在不同产品/服务中进行选择,是市场研究领域中较为常见的一种研究方法。通常是在正交实验设计的基础上,构造一定数量的产品/服务选择集(Choice Set),每个选择集包括多个产品/服务的轮廓(Profile),每一个轮廓是由能够描述产品/服务重要特征的属性(Attributes)以及赋予每一个属性的不同水平(Level)组合构成。例如消费者购买手机的重要属性和水平可能包括:品牌(A,B,C)、价格(1500元,1750万元,2000元)、功能(短信,短信语音,图片短信)等,离散选择模型是测量消费者在给出不同的产品价格、功能条件下是选择购买品牌A,还是品牌B或者品牌C,还是什么都不选择。
离散选择模型的一个重要的假定是:消费者是根据构成产品/服务的多个属性来进行理解和作选择判断;另一个基本假定是:消费者的选择行为要比偏好行为更接近现实情况。
它与传统的全轮廓结合分析(Full Profiles Conjoint Analysis)都是在全轮廓的基础上采用分解的方法测量消费者对某一轮廓(产品)的选择与偏好,对构成该轮廓的多个属性和水平的选择与偏好,用效用值(Utilities)来描述。但是,它与传统的结合分析的最大区别在于:离散选择模型不是测量消费者的偏好,而是获知消费者如何在不同竞争产品选择集中进行选择。
因此,离散选择模型在市场研究之价格研究中是一种更为实际、更有效、也更复杂的技术。具体表现在:
l 将消费者的选择置于模拟的竞争市场环境,“选择”更接近消费者的实际购买行为;消费者的选择行为要比偏好态度更能反映产品不同属性和水平的价值,也更具有针对性;
l 消费者只需做出“买”或“不买”的回答,数据获得更容易,也更准确;
l 消费者可以做出“任何产品都不购买”的决策,这与现实是一致的;
l 实验设计可以排除不合理的产品组合,同时可以分析产品属性水平存在交互作用的情况;
l 离散选择集能够较好地处理产品属性水平个数(大于4)较多的情况;
l 统计分析模型和数据结构更为复杂,但可以模拟更广泛的市场竞争环境;
l 模型分析是在消费者群体层面,而非个体层面。
离散选择模型主要采用离散的、非线性的Multinomial Logit统计分析技术,其因变量是消费者在多个可选产品中,选择购买哪一种产品;而自变量是构成选择集的不同产品属性。
三、离散选择模型的主要步骤
任何一项采用离散选择模型进行的市场研究,都包括从确定研究目的、实验设计、数据收集、数据整理、数据分析和计算、检验与应用、模拟市场、撰写研究报告等全过程,必须借助专用的分析软件来实现。
采用离散选择模型的主要步骤如下:
属性和水平的确定
离散选择模型最重要的一步就是决定能描述产品/服务特征的重要属性。针对不同的研究目的,影响消费者选择购买或使用产品/服务的因素都要考虑。
选择集实验设计
当产品/服务的属性和水平数目不太多时可以将所有的产品/服务组合展现给消费者,即采用全因子实验设计(Full-Factorial Design),这种设计可以估计属性间的主效应(Main Effect),以及估计交互作用。
问卷设计和数据收集
离散选择模型是将产品/服务轮廓的属性水平组合成m种不同产品/服务,构造一个选择集,同时展现给消费者,从中选择一个最可能购买的产品/服务。也可以让消费者评价多个选择集,每个选择集可以包括“在该选择集中,任何产品都不购买”的选择,这样更接近现实情况。
数据编码和整理
离散选择模型对选择集的数据格式有特殊的要求,在进行数据分析之前必须将所有选择集进行重新编码,并与被访者的“选择”结果合并数据。
数据分析
离散选择模型是在消费者群体层面上进行分析,它主要包括两个方面,(1)选择频次分析:通过分析所有被访者对选择集中可选产品的选择频次,得到各属性水平的选择比率,也可以计算不同属性水平二维交互作用的选择比率,一般用百分比表示。(2)Logit模型选择概率分析:当选择数据经过编码整合后,就可以利用Multinomial Logit Model进行数据分析。该模型是一种复杂的多元统计分析过程,前面提到的SAS/STAT和Market模块的Prco PHREG过程可以用来估计未知参数向量
,并计算不同选择集中每个产品的选择概率。
结果检验和解释
离散选择模型的Multinomial Logit选择概率分析,主要是获得未知参数
估计值。参数估计值表明各属性的不同水平影响消费者选择某种产品/服务特征的价值或优先选择的程度,一般用“效用值”表示。效用值越大表明消费者越会首选具有该水平的产品/服务。
应用结果和模拟市场
离散选择模型可以在群体层面上得到影响消费者选择购买或使用产品/服务的属性水平的效用值,进而可以模拟市场竞争环境,构造不同选择集,计算选择频次比率和选择概率,获得消费者在不同产品/服务属性水平下的选择行为。可广泛应用于新产品开发、市场占有率分析、品牌竞争分析、市场细分和价格策略等市场研究领域。
三 、利用SAS应用:离散选择分析
注意的假设
在市场研究中常用于哪些
与一组实行安慰剂治疗的对照组(Control group)进行比较,看治疗方法是否成功
解释妇女的工作行为
选择某一专业学习
在一揽子商品中对某一商品的购买决策 (市场研究)
情景条件下的市场份额建模
根据“回忆者”(表现出来)的特征衡量广告活动的成功
解释顾客价值概念(分类模型)
顾客满意度研究(分类模型)
SAS自带数据集案例操作
这里我们选取一个SAS案例中数据应用来演示下,在离散选择分析中,被访者将对几种方案作出选择。影响选择的一些因素叫做“选择属性”(就像组合分析中的属性一样)。每种可能的选择叫做“选择设定”。
以sasuser中的price为例说明软件的使用:SAS->解决方案->市场研究->找到对应的数据集
选择price数据集,分析方法选择discrete choice analysis,ok后进入一个补充界面,提示数据集形式是否正确,可以点击examine,看数据集是否如其所显示的格式,如果不是则要重新将数据布局。
点击OK后进入变量界面,将要选择布置如下变量:一个因变量(response)、若干选择属性变量(choice)、一个测试变量(subject variable)。也可以选择一个频率变量(frequency)和若干非选择属性变量(non-choice variable),如果选择了频率变量,测试变量可以不必。
此例中,choose作为因变量,并点开下方的箭头,将1选入(1代表选择,0代表不选择)。选择price,band1,band2…band4作为选择属性变量(band5之所以不选,是因为band是一个虚拟变量)。Fre作为频率变量,频率变量记录了做出选择的数目。Set作为选择设定变量(choice set),点击OK。
结果显示band4,band1,price和band2对选择很重要。想了解更多结果,可以从结果菜单中选择“统计量”,“选中概率”来查看属性的系数估计和模型拟合情况,以及每种方案被选择的概率。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27