R语言做多变量可视化分析?
测试开头
测试结尾
笔者邀请您,先思考:
1 什么是多变量可视化分析?
2 多变量的常用可视化图形有哪些?适合在什么场景下应用
(需要内推数据工作,请加微信:luqin360)
多变量可视化分析是一种利用可视化手段探索多个变量之间关系或者模式的一种分析方法。
一 基于不同类型的连续变量的盒箱图
代码:
# R包
library(caret)
# 数据集
data(iris)
x <- iris[,1:4]
y <- iris[,5]
# 不同类型下特征集的可视化
featurePlot(x=x,y=y, plot = "box")
结果:
二 连续变量集的相关图
连续变量集相关系数矩阵的可视化
代码:
# R包
library(corrplot)
# 加载数据集
data(iris)
# 计算相关系数
correlations <- cor(iris[,1:4])
# 创建相关图
corrplot(corr = correlations, method = "number")
结果:
提示:相关图的更多表示,请阅读corrplot()函数的帮助文档 ,help(corrplot)。
三 不同类型下的连续变量的核密度曲线图
代码:
# R包
library(caret)
# 加载数据集
data(iris)
# 不同类别下的变量核密度图
x <- iris[,1:4]
y <- iris[,5]
scales <- list(x=list(relation="free"), y=list(relation="free"))
featurePlot(x=x, y=y, plot = "density", scales=scales)
结果:
四 多变量集的矩阵散点图
代码:
# 数据集
data(iris)
# 成对的散点图
pairs(iris)
结果:
五 考虑类别的多变量集矩阵散点图
代码:
data(iris)
pairs(Species ~., data = iris, col = iris$Species)
结果:
公众号推荐:数据人才(ID:datarencai)
(一个帮助数据人才找工作的公众号,
也分享数据人才学习和生活的有趣事情。)
内容推荐
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!