R语言做单变量可视化分析
测试开头
测试结尾
笔者邀请您,先思考:
1 什么是单变量可视化分析?
2 单变量的常用可视化图形有哪些?适合在什么场景下应用
(需要内推数据工作,请加微信:luqin360)
单变量可视化分析,研究数据点或者样本集中单个连续变量或者离散变量的分布情况,通过可视化的工具来做探索性分析。
一 柱状图
代码:
# R包
library(mlbench)
library(tidyverse)
# 数据集
data("BreastCancer")
# 数据集检视
glimpse(BreastCancer)
BreastCancer %>%
head %>%
View
# 第2个变量到第9个变量的分布图
par(mfrow=c(2,4))
for(i in 2:9){
counts <- table(BreastCancer[,i])
name <- names(BreastCancer)[i]
barplot(counts, main = name)
}
结果:
二 盒箱图
代码:
# 数据集
data(iris)
# 变量1到变量4的盒箱图
par(mfrow=c(1,4))
for(i in 1:4) {
boxplot(iris[,i], main=names(iris)[i])
}
结果:
三 直方图
代码:
# 数据集
data(iris)
# 变量1到变量4的直方图
par(mfrow=c(1,4))
for(i in 1:4) {
hist(iris[,i], main=names(iris)[i])
}
结果:
四 核密度曲线图
代码:
# R包
library(lattice)
# 数据集
data(iris)
# 变量1到变量4的核密度曲线图
par(mfrow=c(1,4))
for(i in 1:4){
plot(density(iris[,i]), main = names(iris)[i])
}
结果:
五 变量集缺失值可视化
代码:
# R包
library(Amelia)
library(mlbench)
# 数据集
data("Soybean")
# 变量集缺失值可视化
missmap(Soybean, col = c("black", "grey"), legend = FALSE)
结论:
公众号推荐:数据人才(ID:datarencai)
(一个帮助数据人才找工作的公众号,
也分享数据人才学习和生活的有趣事情。)
内容推荐
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!