ISLR读书笔记3:Lab1R的介绍
本文介绍第二章:统计学习第三节实验一R的介绍的内容
提纲:
-
基本命令
-
作图
-
索引数据
-
装载数据
-
其他图形和数值摘要
R语言官网:http://www.r-project.org
R好用的集成开发工具RStudio官网:https://www.rstudio.com/
任务一:安装R软件和RStudio软件?
安装过程有什么问题或者心得,请留言。
一、基本命令
赋值符号 <-
函数式命令
向量函数 c()
矩阵函数matrix()
对象列表函数ls()
删除对象函数rm()
均值函数sqrt()
方差函数mean()
标注差函数sd()
满足正态分布的随机数生成函数rnorm()
R代码
##矩阵x
x <- matrix(c(1,2,3,4),2,2)
matrix(c(1,2,3,4),2,2,byrow=TRUE)
## 100个符合标准正态分布的随机数
set.seed(12343)
y <- rnorm(100)
mean(y)
var(y)
sqrt(var(y))
sd(y)
二、作图
R语言擅长作图,可以做高质量图片。
R语言做图,主要三种方法:
-
基础包graphics
-
扩展的作图包
-
lattice包
-
ggplot2包
在这里,从做图基础包graphics入手。
做图函数
plot()
散点图
set.seed('1234')
x <- rnorm(50)
set.seed('2345')
y <- rnorm(50)
plot(x, y, xlab="this is the x-axis",ylab="this is the y-axis",main="Plot of X vs Y")
若是想把图片保存成PDF格式,采用
pdf()函数
例如:
pdf("Figure.pdf")
set.seed('1234')
x <- rnorm(50)
set.seed('2345')
y <- rnorm(50)
plot(x,y,col="green")
dev.off()
三、索引数据
索引数据,利用index获取感兴趣的数据。
例如:
A <- matrix(1:16,4,4) ##生成4*4的矩阵
A
A[2,3] ##获取第2行,第3列的位置的元素值,结果是:10
A[c(1,3),c(2,4)] ##获取第1行、3行和第2列、4列位置上元素的值
A[1:3,2:4] ##获取第1行到第3行、第2列到第4列位置上元素的值
A[,1] ##获取第一列位置上元素的值
A[1,] ##获取第一行位置上元素的值
A[-c(1,3),] ##获取除掉第1行和第3行位置上元素的值
四、装载数据
常用的装载数据函数
read.table()
read.csv()
例如:
iris.data <- iris
write.csv(iris.data, 'iris.csv', row.names = FALSE) ##iris数据集保存到本地文件,格式csv
iris1 <- read.table('iris.csv', header = TRUE, sep = ',') ##转载iris数据
View(head(iris1)) ##查看iris部分数据集
结果
或者,采用read.csv()装载数据
iris2 <- read.csv('iris.csv')
fix(iris2)
五、其他图形和数值摘要
R提供了一个数据集的基础包,查看有哪些默认的数据集
library(help = “datasets”)
现已mtcars数据集为例,看一下其它有趣的图形以及对某一些变量做统计分析,即数值摘要描述。
attach(mtcars)
plot(cyl, mpg) ##散点图
cyl <- as.factor(cyl) ##数值类型变换成因子类型
plot(cyl, mpg) ##垂直盒箱图
plot(cyl, mpg, col="red") ##垂直的红色的盒箱图
plot(cyl, mpg, col="red", varwidth=TRUE, horizontal=TRUE) ##水平的盒箱图
hist(mpg,col=2,breaks=15) ##直方图
pairs(~ mpg + disp + hp + wt) ##生成配对的散点图矩阵
detach(mtcars)
summary(mtcars) ## mtcars数据集摘要分析
部分结果如下
【温馨提示】点击阅读原文,进入数据人网,学习更多有价值的数据知识。
您在阅读中,有什么建议或者想法,请留言。
如果您觉得本文有收获,请小额赞赏,让我有动力继续写出高质量的文章。
数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习。
平台的理念:人人投稿,知识共享;人人分析,洞见驱动;智慧聚合,普惠人人。
您在数据人网平台,可以1)学习数据知识;2)创建数据博客;3)认识数据朋友;4)寻找数据工作;5)找到其它与数据相关的干货。
我们努力坚持做原创,分享和传播有价值的数据知识!
我们都是数据人,数据是有价值的,坚定不移地利用数据价值创造价值!
公众号推荐:《JoyEnglish》
跟Joy老师学习英语口语。
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!