
数据分析-AHP层次分析法
层次分析法(The analytic hierarchy process)简称AHP,在20世纪70年代中期由美国运筹学家托马斯·塞蒂(T.L.Satty)正式提出。它是一种定性和定量相结合的、系统化、层次化的分析方法。由于它在处理复杂的决策问题上的实用性和有效性,很快在世界范围得到重视。它的应用已遍及经济计划和管理、能源政策和分配、行为科学、军事指挥、运输、农业、教育、人才、医疗和环境等领域。
什么是AHP层次分析法?
层次分析法的基本思路与人对一个复杂的决策问题的思维、判断过程大体上是一样的。不妨用假期旅游为例:假如有3个旅游胜地A、B、C供你选择,你会根据诸如景色、费用和居住、饮食、旅途条件等一些准则去反复比较这3个候选地点.首先,你会确定这些准则在你的心目中各占多大比重,如果你经济宽绰、醉心旅游,自然分别看重景色条件,而平素俭朴或手头拮据的人则会优先考虑费用,中老年旅游者还会对居住、饮食等条件寄以较大关注。其次,你会就每一个准则将3个地点进行对比,譬如A景色最好,B次之;B费用最低,C次之;C居住等条件较好等等。最后,你要将这两个层次的比较判断进行综合,在A、B、C中确定哪个作为最佳地点。
层次分析法的基本步骤
运用层次分析法构造系统模型时,大体可以分为以下五个步骤:
1.建立层次结构模型
2.构造判断矩阵
3.一致性检验
4.计算各层权重
5.总体一致性检验
1.建立层次结构模型
层次分析法强调决策问题的层次性,我们必须认清决策目标与决策因素之间的关系。简单地说,就是处理各个因素之间的包含关系,再把它们放在一个层次结构图中。一般地,我们把层次结构图分成3个层次,作为本文的例子,我们以选择旅游地作为问题,演示层次分析法的过程:
目标层:决策的目的、要解决的问题。(选择旅游地)
准则层:考虑的因素、决策的准则。(选择旅游地时会考虑到不同的因素,如景色、费用等)
方案层:决策时的备选方案。(各个景点)
2.构造判断矩阵
建立层次结构图,之后我们就必须讨论同一层因素的权重。仍用上述例子,这时我们要得出c1,c2,c3……对O的影响权重,可把权重记为:
w=[w1 w2 ...wn-1 wn]
可是,当影响因素很多时,权重就非常难估计,而且常常不容易被别人接受。因此Santy等人提出一致矩阵法,即不把所有因素放在一起比较,而是两两相互比较。(aij在 1-9 及其倒数中间取值)
aij = 1,元素 i 与元素 j 对上一层次因素的重要性相同;
aij = 3,元素 i 比元素 j 略重要;
aij = 5,元素 i 比元素 j 重要;
aij = 7, 元素 i 比元素 j 重要得多;
aij = 9,元素 i 比元素 j 的极其重要;
aij = 2n,n=1,2,3,4,元素 i 与 j 的重要性介于aij = 2n − 1与aij = 2n + 1之间;
,n=1,2,...,9, 当且仅当aji = n
成对比较矩阵的特点:(备注:当i=j时候,aij = 1)
这时我们就可以得到判断矩阵,也就是每两个因素的权重比:
(1)
为帮助理解,此处加入一个权重比表(实际使用过程中可省略),假设所得的权重比如下表所示,第二行第一列表示费用与景色的重要性比为2,第一行第二列表示景色与费用的重要性比为1/2,以此类推,转换后可得到矩阵A。
|
景色 |
费用 |
居住 |
饮食 |
旅途 |
景色 |
1 |
1/2 |
4 |
3 |
3 |
费用 |
2 |
1 |
7 |
5 |
5 |
居住 |
1/4 |
1/7 |
1 |
1/2 |
1/3 |
饮食 |
1/3 |
1/5 |
2 |
1 |
1 |
旅途 |
1/3 |
1/5 |
3 |
1 |
1 |
(2)
有了判断矩阵,我们就可以得到各个因素的权重。矩阵A右乘w
Aw=nw (3)
也就是说我们只要令(A-n)w=0和|w|=1,就可以算w。
例如:一个三阶的矩阵a、b、c,判断矩阵为
令(A-3)w=0,就有w=[0.6 0.3 0.1]
3.一致性检验
仔细查看(2),其实是有问题的。判断矩阵可能会出现不一致的情况,表现为(3)不成立。
如果说a比b重要2倍,b比c重要3倍,然后说c比a重要2倍,这就有问题了。这就是所谓的不一致现象。(2)就是出现了这一现象。那么,这时权重又如何确定?
学过线性代数的话,我们知道(3)中,n是A的特殊值,而w是A的特殊向量。在出现不一致的情况下,Saaty等人建议用对应于最大特征根l的特征向量作为权向量w,即
由于λ连续的依赖于aij,则λ比n大的越多,A的不一致性越严重。用最大特征值对应的特征向量作为被比较因素对上层某因素影响程度的权向量,其不一致程度越大,引起的判断误差越大。因而可以用λ-n数值的大小来衡量A的不一致程度。
定义一致性指标:
CI=0,有完全的一致性
CI接近于0,有满意的一致性
CI 越大,不一致越严重
定义随机一致性指标 RI:它的值与n的关系如下:
定义一致性比率 :
一般,当一致性比率<0.1时,认为A的不一致程度在容许范围之内,有满意的一致性,通过一致性检验。可用其归一化特征向量作为权向量,否则要重新构造成对比较矩阵A,对aij加以调整。
一致性检验也就是利用一致性指标和一致性比率<0.1,及随机一致性指标的数值表,对A进行检验的过程
4.计算各层权重
我们最终目的是要确定P1,P2,P3对O的影响权重。
我们先从C1开始,计算出P1,P2,P3的权重,记为
wc1=[wp1 wp2 wp3]T;
同理算出C2权向量wc2,C3的权向量wc3……再回到O,计算出
WO=[wo1,wo2,wo3,wo4,wo5]T
这时P1对O的影响权重就是
k1=wp1*wo1+wp2*wo2+……wp5*wo5
用矩阵的语言来说,说是P1,P2,P3对O的影响权重为:
K=WC*WO
其中,WC=[wc1 wc2 wc3 wc4 wc5]
5.总体一致性检验
定义总体一致性比率:
其中CIi是下层的一致性指标,RIi是下层的随机一致性指标,ai是权重。
同样的,如果CR<0.1,那么一致性在容许范围之内。
层次分析法的注意事项
如果所选的要素不合理,其含义混淆不清,或要素间的关系不正确,都会降低AHP法的结果质量,甚至导致AHP法决策失败。
为保证递阶层次结构的合理性,需把握以下原则:数据分析培训
1.分解简化问题时把握主要因素,不漏不多;
2.注意相比较元素之间的强度关系,相差太悬殊的要素不能在同一层次比较。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
CDA数据分析师与数据指标:基础概念与协同逻辑 一、CDA 数据分析师:数据驱动时代的核心角色 1.1 定义与行业价值 CDA(Certified ...
2025-08-22Power Query 移动加权平均计算 Power Query 移动加权平均设置全解析:从原理到实战 一、移动加权平均法的核心逻辑 移动加权平均 ...
2025-08-22描述性统计:CDA数据分析师的基础核心与实践应用 一、描述性统计的定位:CDA 认证的 “入门基石” 在 CDA(Certified Data Analy ...
2025-08-22基于 Python response.text 的科技新闻数据清洗去噪实践 在通过 Python requests 库的 response.text 获取 API 数据后,原始数据 ...
2025-08-21基于 Python response.text 的科技新闻综述 在 Python 网络爬虫与 API 调用场景中,response.text 是 requests 库发起请求后获取 ...
2025-08-21数据治理新浪潮:CDA 数据分析师的战略价值与驱动逻辑 一、数据治理的多维驱动引擎 在数字经济与人工智能深度融合的时代,数据治 ...
2025-08-21Power BI 热力地图制作指南:从数据准备到实战分析 在数据可视化领域,热力地图凭借 “直观呈现数据密度与分布趋势” 的核心优势 ...
2025-08-20PyTorch 矩阵运算加速库:从原理到实践的全面解析 在深度学习领域,矩阵运算堪称 “计算基石”。无论是卷积神经网络(CNN)中的 ...
2025-08-20数据建模:CDA 数据分析师的核心驱动力 在数字经济浪潮中,数据已成为企业决策的核心资产。CDA(Certified Data Analyst)数据分 ...
2025-08-20KS 曲线不光滑:模型评估的隐形陷阱,从原因到破局的全指南 在分类模型(如风控违约预测、电商用户流失预警、医疗疾病诊断)的评 ...
2025-08-20偏态分布:揭开数据背后的非对称真相,赋能精准决策 在数据分析的世界里,“正态分布” 常被视为 “理想模型”—— 数据围绕均值 ...
2025-08-19CDA 数据分析师:数字化时代的价值创造者与决策智囊 在数据洪流席卷全球的今天,“数据驱动” 已从企业战略口号落地为核心 ...
2025-08-19CDA 数据分析师:善用 Power BI 索引列,提升数据处理与分析效率 在 Power BI 数据分析流程中,“数据准备” 是决定后续分析质量 ...
2025-08-18CDA 数据分析师:巧用 SQL 多个聚合函数,解锁数据多维洞察 在企业数据分析场景中,单一维度的统计(如 “总销售额”“用户总数 ...
2025-08-18CDA 数据分析师:驾驭表格结构数据的核心角色与实践应用 在企业日常数据存储与分析场景中,表格结构数据(如 Excel 表格、数据库 ...
2025-08-18PowerBI 累计曲线制作指南:从 DAX 度量到可视化落地 在业务数据分析中,“累计趋势” 是衡量业务进展的核心视角 —— 无论是 “ ...
2025-08-15Python 函数 return 多个数据:用法、实例与实战技巧 在 Python 编程中,函数是代码复用与逻辑封装的核心载体。多数场景下,我们 ...
2025-08-15CDA 数据分析师:引领商业数据分析体系构建,筑牢企业数据驱动根基 在数字化转型深化的今天,企业对数据的依赖已从 “零散分析” ...
2025-08-15随机森林中特征重要性(Feature Importance)排名解析 在机器学习领域,随机森林因其出色的预测性能和对高维数据的适应性,被广 ...
2025-08-14t 统计量为负数时的分布计算方法与解析 在统计学假设检验中,t 统计量是常用的重要指标,其分布特征直接影响着检验结果的判断。 ...
2025-08-14