
众所周知,无论是一个国家还是一个企业,在制定决策策略的时候,都不会询问每一个人的意见,对于国家而言,通常会收集各行各业代表的意见;对于企业而言,则是会选择一些有代表性的人员来进行意见调研。
同理,当我们需要对大量数据进行分析时,是否一定要纳入很多变量来构建模型呢?比如逻辑回归模型可纳入的变量个数是比较少的,那么当变量个数成千上万时,还可以来构建逻辑回归模型吗?此时,就需要引入维度分析的思想。
即选取一些重要维度中有代表性的变量来进行分析。比如某电信公司想要预测客户是否流失,而影响客户流失的维度有很多,比如有服务质量(信号差、计费错误)、费用高等等。
当你遇到这些问题时,如何快速找到问题的关键,从各维度中选取有代表性变量进行分析呢?
一般来讲,收集的数据中有很多是高度相关的,这表明这些变量很可能提供同一个维度的信息,这就需要对数据进行压缩,从大量的数据中归纳出少量的、最具有代表性的变量,选取的变量应该满足同目标变量相关且各个变量之间互不相关两个基本要求。
矩阵分析法的基本思想就是大数据小分析,所谓大数据小分析就是在做决策时对数据进行降维,以便决策者更加明确的了解事务的本质。所以,在学习矩阵分析法之前先来引入维度分析的思想。
从成千上万的变量中选择这样符合条件的变量,这就是维度分析的概念。这里的维度是指表述事物的不同方面。比如从长、宽、高3个维度描述立体形状;从思维、认识、创造、适应环境和表达这5个维度表述个人的智力情况。
分析:企业中可以获取的关于产品的信息有很多,比如利润率、费用比率、年销售增长率、市场饱和度、产品知名度、专利覆盖度和市场占有率等。这些信息初想起来对制订产品发展战略都有意义。然而波士顿咨询公司认为,只有相对市场占有率和市场成长率这两个变量在回答这个问题上最有价值,并将其固化为了“波士顿矩阵”,如图1所示。
那么,为什么会选择这两个变量呢?原因在于产品相对市场占有率和利润率、产品知名度有较强的关系,反映该产品的市场地位和产生现金流的能力,而市场成长率和市场饱和度强相关,反映产品的市场发展潜力,也就是说这两个变量是最具有代表性的两个变量,符合维度分析的基本思想。
(图1)
这两个代表性变量背后隐含的其实是在做产品分析时总会说到的所谓的产品生命周期理论,产品生命周期指的是随着时间的推移,产品总会经历初创期、成长期、成熟期和衰退期这几个阶段,如图2所示。
可以看出,在初创期,产品的收益率存在波动性,且成长率不太高;蛰伏很长时间后,产品进入成长期,销售额及盈利均呈现快速增长趋势;之后进入成熟期,该时期市场增长率开始降低,同时伴随着前期投资的变现,收益率增高;最后是衰退期,该时期如果追加投资,净资产收益率(ROE)会很低,而且很多衰退期的产品已经达到了红海的情况,竞争非常激烈,增长率也会偏低。
(图2)
进一步分析,市场成长率反映了产品生命周期的变化情况,而市场占有率反映了企业的具体产品的市场渗透情况,也就是说它们是两个独立的变量,分别反映不同维度(市场成长率反映了市场的情况,市场占有率反映了企业在市场上的情况)的信息,通过不同的维度对产品做出很好的分类。
以2005年的IBM为例,我们来看下IBM对于个人笔记本(PC)、服务器、咨询这几种不同类型的产品做出了怎样的决策,首先是PC业务,市场占有率并不高,同时市场成长率也比较低,属于瘦狗产品;其次是服务器业务,其市场占有率非常高,市场成长率处于成长期和成熟期之间,处于金牛和明星产品之间,更偏向于金牛产品;最后是咨询业务,其市场成长率很高,处于成长期,但是市场占有率偏低,属于问号产品。
根据以上分析背景,IBM公司做出了以下决策:瘦狗产品PC直接进行了出售,金牛产品服务器继续保留投资,问号产品咨询业务经过不断扶持发展成为了明星产品,之后发展成为了金牛产品,最后进入瘦狗产品的行列。
上述案例分析表明,波士顿矩阵分析可以帮助企业制定出不同的产品发展战略,包括资源分配、拟定业务战略、制定绩效目标以及平衡投资组合等。具体来讲,对于瘦狗产品,一般不会对其进行发展性资源的分配,而且制定的绩效会比较苛刻;对于问号产品,就要观察其未来市场的发展情况,如果发展良好,市场占有率不断增大,则可以考虑为其配置战略性资源,制定温和的绩效目标(比如客户粘性、客户增长率、客户好评度等等),而金牛产品更加关注收益类指标,对于客户粘性基本不做过多关注。
最后,波士顿矩阵的象限特征总结如下,根据不同类型产品的特征制定不同的发展战略。
(图3)
在矩阵分析法中,问号产品的发展轨迹如下:
(图4)
分析:模拟波士顿矩阵,波士顿咨询公司也给出了示例答案,描述这个问题的两个重要变量分别是市场规模和市场增长率,如图5所示,运用这两个变量对省份进行分类,从而做出相应的选择。同时,除了上述变量外,还引入了第三个变量市场收入增长额。
(图5)
可以看出,江苏、浙江在市场规模较大且市场增长率也较高。
分析:在行业选择方面的判断涉及到的指标较为复杂,经分析,大数据价值潜力指数和海量数据捕捉难易程度指数这两个指标在信息、数据等方面都更具备综合性。以美国经济为例,如图6所示。
(图6)
通过分析数据获取的难易程度和数据的价值,做出行业的选择。
分析:根据波士顿矩阵分析思路,对个体客户打标签,通过聚类分析,得到客户的类别,并且投影在由循环信用次数和交易次数这两个指标组成的二维空间上,便于业务人员理解。其中,交易次数反映的是客户的粘性,循环信用次数反映的是客户的价值,总之,也是通过维度分析的方法对客户进行了分类。
(图7)
以上几个例子都使用的是维度分析的方法,即决策层根据矩阵分析的结果获得决策的依据,决定产品的投资与否;如果假设当前还没有波士顿矩阵,那么数据分析师该如何产出该矩阵呢?即如何从成千上万的指标中选择出有代表性的指标进行分析呢?
这就用到了常用的信息压缩方法—主成分分析法,主成分分析法会帮助我们将多个指标压缩到少量的几个综合指标,但是这几个综合指标没有实际的业务含义,所以就产生了因子分析,因子分析可以在主成分分析的基础上帮助我们探查相应的业务含义,最终可以直接根据因子分析的结果构建相应的分析矩阵,也可以根据因子分析的结果发现与因子相关的变量,根据代表性的变量构造分析矩阵。
在现实情况中,由于获取的数据日益丰富,建模使用的原始数据可能有成千上万个变量,这么多的变量对于建模的解释会造成一定的困难。其中的一大危险就是引入了冗余变量。针对冗余变量的问题,通常依据降维的理念对多维连续变量的数据进行处理,从而达到变量筛选和降维的目的。
降维的本质就是去除冗余变量,保留主要变量。在进行建模时,一般原始数据的变量非常多,若直接建模,计算量会随变量数量的增加呈指数增长,同时模型稳定性下降,维护成本增加。此时就需要通过各种办法降低数据的维度并筛选对模型有用的变量。若数据的维度能够被降低到符合预期的程度并且不至于损失太多对模型有用的信息,那么,这种降维就是理想的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03