【R每日一贴】基本统计量计算
R具有非常强大的计算功能,R可以作为一个“大计算器”。基本统计量计算主要包括:均值计算、中位数计算、标准差计算、方差计算、协方差和相关系数计算。
R中如何完成上述计算,汇总如下。
基本统计量一:均值计算。使用mean()函数计算均值。
基本统计量二:中位数计算。使用median()函数计算中位数。
基本统计量三:标准差计算。使用sd()函数计算标准差。
基本统计量四:方差计算。使用var()函数计算方差。
基本统计量五:协方差计算。使用cov()函数计算协方差。
基本统计量六:相关系数计算。使用cor()函数计算相关系数。
关于R基本统计量计算,举例说明如下。
> data1 <- c(1, 3, 5, 7, 9)
> data1
[1] 1 3 5 7 9
> mean(data1)
[1] 5
> median(data1)
[1] 5
> sd(data1)
[1] 3.162278
> var(data1)
[1] 10
> data2 <- c(2, 4, 6, 8, 10)
> data2
[1] 2 4 6 8 10
> mean(data2)
[1] 6
> median(data2)
[1] 6
> sd(data2)
[1] 3.162278
> var(data2)
[1] 10
> cov(data1, data2)
[1] 10
> cor(data1, data2)
[1] 1
注意:关于基本统计量计算的函数对于数据缺失值敏感。某个变量的缺失值可能导致函数返回NA结果或是计算结果报错。数据中缺失值是否对统计结果产生严重影响?若是,计算机报错是正确的;若不是,可以通过设置参数na.rm=TRUE,告知R忽略缺失值。例如
> data3 <- c(1, 2, 3, NA)
> data3
[1] 1 2 3 NA
> mean(data3)
[1] NA
> mean(data3, na.rm=TRUE)
[1] 2
> sd(data3)
[1] NA
> sd(data3, na.rm=TRUE)
[1] 1
R基本统计量是统计分析的基本,一方面需要理解每个统计量的物理含义和统计意义,另一方面需要掌握如何基于R 计算各个基本统计量。
【想一想】
1基本统计量有哪些?每一种统计量表示什么含义?
2标准差和方差的计算公式是什么?
【做一做】
1查看women数据集,计算变量height和weight的均值、中位数、标准差、方差以及两者之间的协方差和相关系数。
2自定义峰度和偏度函数,计算上述变量的峰度和偏度。
【温馨话语】
我改变不了他人,但是,我可以改变自己。我控制不了天气,但是,我可以控制心情。
我是陆勤,微信号:wangluqing360,你们在R路上的朋友,一起欣赏R路上的风景。PPV课R语言群:342699237,欢迎朋友们加入,共建最好的R社区。
赠人玫瑰,手有余香。若是觉得此文有用,欢迎分享给更多的人,让更多的人受用。
你若安好,便是晴天。若是朋友们有什么想法或建议,欢迎给我留言或者私信于我。
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!