使用R语言绘制其他图形之相关系数图-CDA数据分析师官网

热线电话：13121318867

使用R语言绘制其他图形之相关系数图

2018-05-22

使用R语言绘制其他图形之相关系数图

虽然cor()函数可以非常方便快捷的计算出连续变量之间的相关系数，但当变量非常多时，返回的相关系数一定时读者看的眼花缭乱。

下面就以R自带的mtcars数据集为例，讲讲相关系数图的绘制：

cor(mtcars[1:7])
很显然，这么多数字堆在一起肯定很难快速的发现变量之间的相关性大小，如果可以将相关系数可视化，就能弥补一大堆数字的缺陷了。这里介绍corrplot包中的corrplot()函数进行相关系数的可视化，首先来看看该函数的语法和一些重要参数：

corrplot(corr,

method = c("circle", "square", "ellipse", "number", "shade", "color", "pie"),

type = c("full", "lower", "upper"), add = FALSE,

col = NULL, bg = "white", title = "", is.corr = TRUE,

diag = TRUE, outline = FALSE, mar = c(0,0,0,0),

addgrid.col = NULL, addCoef.col = NULL, addCoefasPercent = FALSE,

order = c("original", "AOE", "FPC", "hclust", "alphabet"),

hclust.method = c("complete", "ward", "single", "average",

"mcquitty", "median", "centroid"),

addrect = NULL, rect.col = "black", rect.lwd = 2,

tl.pos = NULL, tl.cex = 1,

tl.col = "red", tl.offset = 0.4, tl.srt = 90,

cl.pos = NULL, cl.lim = NULL,

cl.length = NULL, cl.cex = 0.8, cl.ratio = 0.15,

cl.align.text = "c",cl.offset = 0.5,

addshade = c("negative", "positive", "all"),

shade.lwd = 1, shade.col = "white",

p.mat = NULL, sig.level = 0.05,

insig = c("pch","p-value","blank", "n"),

pch = 4, pch.col = "black", pch.cex = 3,

plotCI = c("n","square", "circle", "rect"),

lowCI.mat = NULL, uppCI.mat = NULL, ...)

corr：需要可视化的相关系数矩阵

method：指定可视化的方法，可以是圆形、方形、椭圆形、数值、阴影、颜色或饼图形

type：指定展示的方式，可以是完全的、下三角或上三角

col：指定图形展示的颜色，默认以均匀的颜色展示

bg：指定图的背景色

title：为图形添加标题

is.corr：是否为相关系数绘图，默认为TRUE，同样也可以实现非相关系数的可视化，只需使该参数设为FALSE即可

diag：是否展示对角线上的结果，默认为TRUE

outline：是否绘制圆形、方形或椭圆形的轮廓，默认为FALSE

mar：具体设置图形的四边间距

addgrid.col：当选择的方法为颜色或阴影时，默认的网格线颜色为白色，否则为灰色

addCoef.col：为相关系数添加颜色，默认不添加相关系数，只有方法为number时，该参数才起作用

addCoefasPercent：为节省绘图空间，是否将相关系数转换为百分比格式，默认为FALSE

order：指定相关系数排序的方法，可以是原始顺序(original)、特征向量角序(AOE)、第一主成分顺序(FPC)、层次聚类顺序(hclust)和字母顺序，一般”AOE”排序结果都比”FPC”要好

hclust.method：当order为hclust时，该参数可以是层次聚类中ward法、最大距离法等7种之一

addrect：当order为hclust时，可以为添加相关系数图添加矩形框，默认不添加框，如果想添加框时，只需为该参数指定一个整数即可

rect.col：指定矩形框的颜色

rect.lwd：指定矩形框的线宽

tl.pos：指定文本标签(变量名称)的位置，当type=full时，默认标签位置在左边和顶部(lt)，当type=lower时，默认标签在左边和对角线(ld)，当type=upper时，默认标签在顶部和对角线，d表示对角线，n表示不添加文本标签

tl.cex：指定文本标签的大小

tl.col：指定文本标签的颜色

cl.pos：图例（颜色）位置，当type=upper或full时，图例在右表(r)，当type=lower时，图例在底部，不需要图例时，只需指定该参数为n

addshade：只有当method=shade时，该参数才有用，参数值可以是negtive/positive和all，分表表示对负相关系数、正相关系数和所有相关系数添加阴影。注意：正相关系数的阴影是45度，负相关系数的阴影是135度

shade.lwd：指定阴影的线宽

shade.col：指定阴影线的颜色

虽然该函数的参数比较多，但可以组合各种参数，灵活实现各种各样的相关系数图。下面就举几个例子：

library(corrplot)

corr <- cor(mtcars[,1:7])

#参数全部默认情况下的相关系数图

corrplot(corr = corr)

#指定数值方法的相关系数图

corrplot(corr = corr, method="number", col="black", cl.pos="n")

#按照特征向量角序(AOE)排序相关系数图

corrplot(corr = corr, order = 'AOE')

#同时添加相关系数值

corrplot(corr = corr, order ="AOE", addCoef.col="grey")

#选择方法为color

corrplot(corr = corr, method = 'color', order ="AOE", addCoef.col="grey")

我觉得这幅图比上面的圆形图要清爽很多

#绘制圆形轮廓相关系数图

corrplot(corr = corr, col = wb, order="AOE", outline=TRUE, cl.pos="n")

这个图看起来非常像围棋

#自定义背景色

corrplot(corr = corr, col = wb, bg="gold2", order="AOE", cl.pos="n")

#混合方法之上三角为圆形，下三角为数字

corrplot(corr = corr,order="AOE",type="upper",tl.pos="d")

corrplot(corr = corr,add=TRUE, type="lower", method="number",order="AOE",diag=FALSE,tl.pos="n", cl.pos="n")

这幅图将颜色、圆的大小和数值型相关系数相结合，更容易发现变量之间的相关性

#混合方法之上三角为圆形，下三角为方形

corrplot(corr = corr,order="AOE",type="upper",tl.pos="d")

corrplot(corr = corr,add=TRUE, type="lower", method="square",order="AOE",diag=FALSE,tl.pos="n", cl.pos="n")

#混合方法之上三角为圆形，下三角为黑色数字

corrplot(corr = corr,order="AOE",type="upper",tl.pos="tp")

corrplot(corr = corr,add=TRUE, type="lower", method="number",order="AOE", col="black",diag=FALSE,tl.pos="n", cl.pos="n")

个人更倾向于上图的展现形式，既清爽又能很好的反映变量间的相关系数。

#以层次聚类法排序

corrplot(corr = corr, order="hclust")

#以层次聚类法排序，并绘制3个矩形框

corrplot(corr = corr, order="hclust", addrect = 3, rect.col = "black")

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

层次聚类特征向量特征 R语言

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇python机器学习案例教程—K最近邻算法的实现

下一篇Python内置函数reversed()用法分析

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

使用R语言绘制其他图形之相关系数图

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA持证人专访：贺译册谈产品经理的市场洞察力与数 ...

【CDA干货】多维度对比评估：分析逻辑与可视化效果 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

【CDA干货】漏斗拆解：核心逻辑、实操方法与业务优 ...

【CDA干货】SQL数值转日期函数全解析：主流数据库语 ...

数据分析必修课：CDA数据分析师视角下的表格结构数 ...

CDA持证人专访：杨旭谈数据产品经理的工作实践与核 ...

【CDA干货】Python变量定义与类实例化：核心原理、 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】联合索引与覆盖索引：本质区别、实战场 ...

【CDA干货】维度表与事实表：数据仓库建模的核心逻 ...

从“指标堆砌”到“体系落地”：CDA数据分析师视角 ...

【CDA干货】SQL计算列值趋势的全场景实现方法与实战 ...

【CDA干货】用户决策链路全解析：从认知到复购的增 ...

CDA 三级《敏捷数据挖掘》教材知识体系全面解读 ...

【CDA干货】付费玩家流失的核心原因与游戏行业长效 ...

CDA持证人专访：蒋少寒谈传统制造业与互联网行业数 ...

学完商业数据分析，开启 CDA 量化策略：从业务思维 ...

CDA持证人专访：赵森淼谈药企数据分析从业体验与转 ...

【CDA干货】卡方检验与T检验结果的标准化解读方法及 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载