
SAS市场研究应用介绍:离散选择分析
一、离散选择分析(discrete choice analysis)介绍
联合分析是用来发掘消费者的偏好,指出了消费者将选择购买哪种组合(联合分析相关内容具体请参考上一文章介绍:SAS市场研究应用介绍:组合/联合分析)。在市场研究中,消费者实际做的选择是一种利益行为,那么用离散选择分析方法来直接分析消费者的选择是明智的,即离散选择法的目标是通过(特定个体的或者特定类别的)协变量解释所观察到的在离散对象中进行的抉择。
离散选择分析(模型),也叫做基于选择的结合分析模型(Choice-Based Conjoint Analysis),是一种非常有效且实用的技术,也是SAS市场研究模块中常用的一种技术方法。该模型是在实验设计的基础上,通过模拟所要研究产品/服务的市场竞争环境,来测量消费者的购买行为,从而获知消费者如何在不同产品/服务属性水平和价格条件下进行选择。这种技术可广泛应用于新产品开发、市场占有率分析、品牌竞争分析、市场细分和价格策略等市场营销领域。同时离散选择分析/模型也是一种处理离散的、非线性的定性数据的复杂高级多元统计分析技术,它采用Multinomial Logit Model进行数据分析。
二、离散选择分析/模型的基本概念和原理
离散选择模型主要用于测量消费者在实际或模拟的市场竞争环境下如何在不同产品/服务中进行选择,是市场研究领域中较为常见的一种研究方法。通常是在正交实验设计的基础上,构造一定数量的产品/服务选择集(Choice Set),每个选择集包括多个产品/服务的轮廓(Profile),每一个轮廓是由能够描述产品/服务重要特征的属性(Attributes)以及赋予每一个属性的不同水平(Level)组合构成。例如消费者购买手机的重要属性和水平可能包括:品牌(A,B,C)、价格(1500元,1750万元,2000元)、功能(短信,短信语音,图片短信)等,离散选择模型是测量消费者在给出不同的产品价格、功能条件下是选择购买品牌A,还是品牌B或者品牌C,还是什么都不选择。
离散选择模型的一个重要的假定是:消费者是根据构成产品/服务的多个属性来进行理解和作选择判断;另一个基本假定是:消费者的选择行为要比偏好行为更接近现实情况。
它与传统的全轮廓结合分析(Full Profiles Conjoint Analysis)都是在全轮廓的基础上采用分解的方法测量消费者对某一轮廓(产品)的选择与偏好,对构成该轮廓的多个属性和水平的选择与偏好,用效用值(Utilities)来描述。但是,它与传统的结合分析的最大区别在于:离散选择模型不是测量消费者的偏好,而是获知消费者如何在不同竞争产品选择集中进行选择。
因此,离散选择模型在市场研究之价格研究中是一种更为实际、更有效、也更复杂的技术。具体表现在:
l 将消费者的选择置于模拟的竞争市场环境,“选择”更接近消费者的实际购买行为;消费者的选择行为要比偏好态度更能反映产品不同属性和水平的价值,也更具有针对性;
l 消费者只需做出“买”或“不买”的回答,数据获得更容易,也更准确;
l 消费者可以做出“任何产品都不购买”的决策,这与现实是一致的;
l 实验设计可以排除不合理的产品组合,同时可以分析产品属性水平存在交互作用的情况;
l 离散选择集能够较好地处理产品属性水平个数(大于4)较多的情况;
l 统计分析模型和数据结构更为复杂,但可以模拟更广泛的市场竞争环境;
l 模型分析是在消费者群体层面,而非个体层面。
离散选择模型主要采用离散的、非线性的Multinomial Logit统计分析技术,其因变量是消费者在多个可选产品中,选择购买哪一种产品;而自变量是构成选择集的不同产品属性。
三、离散选择模型的主要步骤
任何一项采用离散选择模型进行的市场研究,都包括从确定研究目的、实验设计、数据收集、数据整理、数据分析和计算、检验与应用、模拟市场、撰写研究报告等全过程,必须借助专用的分析软件来实现。
采用离散选择模型的主要步骤如下:
属性和水平的确定
离散选择模型最重要的一步就是决定能描述产品/服务特征的重要属性。针对不同的研究目的,影响消费者选择购买或使用产品/服务的因素都要考虑。
选择集实验设计
当产品/服务的属性和水平数目不太多时可以将所有的产品/服务组合展现给消费者,即采用全因子实验设计(Full-Factorial Design),这种设计可以估计属性间的主效应(Main Effect),以及估计交互作用。
问卷设计和数据收集
离散选择模型是将产品/服务轮廓的属性水平组合成m种不同产品/服务,构造一个选择集,同时展现给消费者,从中选择一个最可能购买的产品/服务。也可以让消费者评价多个选择集,每个选择集可以包括“在该选择集中,任何产品都不购买”的选择,这样更接近现实情况。
数据编码和整理
离散选择模型对选择集的数据格式有特殊的要求,在进行数据分析之前必须将所有选择集进行重新编码,并与被访者的“选择”结果合并数据。
数据分析
离散选择模型是在消费者群体层面上进行分析,它主要包括两个方面,(1)选择频次分析:通过分析所有被访者对选择集中可选产品的选择频次,得到各属性水平的选择比率,也可以计算不同属性水平二维交互作用的选择比率,一般用百分比表示。(2)Logit模型选择概率分析:当选择数据经过编码整合后,就可以利用Multinomial Logit Model进行数据分析。该模型是一种复杂的多元统计分析过程,前面提到的SAS/STAT和Market模块的Prco PHREG过程可以用来估计未知参数向量,并计算不同选择集中每个产品的选择概率。
结果检验和解释
离散选择模型的Multinomial Logit选择概率分析,主要是获得未知参数估计值。参数估计值表明各属性的不同水平影响消费者选择某种产品/服务特征的价值或优先选择的程度,一般用“效用值”表示。效用值越大表明消费者越会首选具有该水平的产品/服务。
应用结果和模拟市场
离散选择模型可以在群体层面上得到影响消费者选择购买或使用产品/服务的属性水平的效用值,进而可以模拟市场竞争环境,构造不同选择集,计算选择频次比率和选择概率,获得消费者在不同产品/服务属性水平下的选择行为。可广泛应用于新产品开发、市场占有率分析、品牌竞争分析、市场细分和价格策略等市场研究领域。
三 、利用SAS应用:离散选择分析
注意的假设
在市场研究中常用于哪些
与一组实行安慰剂治疗的对照组(Control group)进行比较,看治疗方法是否成功
解释妇女的工作行为
选择某一专业学习
在一揽子商品中对某一商品的购买决策 (市场研究)
情景条件下的市场份额建模
根据“回忆者”(表现出来)的特征衡量广告活动的成功
解释顾客价值概念(分类模型)
顾客满意度研究(分类模型)
SAS自带数据集案例操作
这里我们选取一个SAS案例中数据应用来演示下,在离散选择分析中,被访者将对几种方案作出选择。影响选择的一些因素叫做“选择属性”(就像组合分析中的属性一样)。每种可能的选择叫做“选择设定”。
以sasuser中的price为例说明软件的使用:SAS->解决方案->市场研究->找到对应的数据集
选择price数据集,分析方法选择discrete choice analysis,ok后进入一个补充界面,提示数据集形式是否正确,可以点击examine,看数据集是否如其所显示的格式,如果不是则要重新将数据布局。
点击OK后进入变量界面,将要选择布置如下变量:一个因变量(response)、若干选择属性变量(choice)、一个测试变量(subject variable)。也可以选择一个频率变量(frequency)和若干非选择属性变量(non-choice variable),如果选择了频率变量,测试变量可以不必。
此例中,choose作为因变量,并点开下方的箭头,将1选入(1代表选择,0代表不选择)。选择price,band1,band2…band4作为选择属性变量(band5之所以不选,是因为band是一个虚拟变量)。Fre作为频率变量,频率变量记录了做出选择的数目。Set作为选择设定变量(choice set),点击OK。
结果显示band4,band1,price和band2对选择很重要。想了解更多结果,可以从结果菜单中选择“统计量”,“选中概率”来查看属性的系数估计和模型拟合情况,以及每种方案被选择的概率。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09