【陆勤笔记】《R语言与统计分析》3概率与分布
概要
随机抽样的实现
常用的概率分布及数字特征
R中内嵌的分布
随机抽样
概率论早期研究的是游戏和赌博等随机现象中有关的概率问题。
R中可以通过函数sample()来实现。
等可能的不放回抽样
> sample(1:52, 4)
[1] 17 49 23 26等可能的有放回抽样
> sample(c("H","T"), 10, replace=TRUE)
[1]"T" "T" "H" "T" "T""H" "T" "H" "T" "T"
> sample(1:6, 10, replace=TRUE)
[1]6 3 1 2 2 4 6 5 1 6
不等可能的随机抽样
> sample(c(1,0), 50, replace=TRUE,prob=c(0.9, 0.1))
[1]1 1 1 1 1 1 1 1 0 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 1 0 1 0 1
[37] 0 1 1 1 1 1 1 1 1 1 1 1 1 1排列组合与概率的计算
利用prod()函数计算阶乘。
利用choose()函数计算组合。
概率分布
概率论与数理统计是研究随机现象统计规律的一门学科。
离散的分布律和连续的概率密度函数。
离散分布的分布律
贝努利分布
二项分布
多项分布
负二项分布
几何分布
超几何分布
泊松分布
连续分布的概率密度函数
均匀分布
指数分布
正态分布(高斯分布)
还有其他分布,就不列举了。
详情可以参阅教材。
R中的内嵌分布
R提供了四类有关统计分布的函数:密度函数、(累计)分布函数、分位数函数和随机数函数。
R中提供了18个分布的英文名称,R中名称和函数中的选项如下表所示。
若R中的分布函数名为func,四类函数调用格式为:
应用:中心极限定理
中心极限定理
渐进正态性的图形检验
自定义的函数limite.central(),已知一个分布产生容量为n的样本经标准化后趋于标准正态分布的近似程度。
总结
1随机抽样的形式和R中的实现方法。
2概率分布的表示方式和具体形式,离散的概率分布律和连续的概率密度函数。
3 R中与概率分布相关的四类函数认识与应用。
【互动交流】
无论您是投资人、创业者,还是从业者、R语言爱好者,愿意深入交流的朋友,请给陆勤留言或者添加陆勤微信:luqin360。
谢谢您的关注,祝好。
【公众号推荐】
数据科学自媒体,分享数据科学的内容。
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!