【陆勤笔记】《深入浅出统计学》15相关与回归:我的线条如何?
测试开头
测试结尾
了解事物之间的相互关系可以丰富你的信息,让你了解真相,使你立于不败之地。
发现事物之间的相互关系:相关与回归。
数据类型探讨
单变量数据考虑的是一个单一变量的频数或者概率。
二变量数据给出两个变量的数值,如果其中一个变量以某种方式受到控制,或者被用来解释另一个变量,则这个变量被称为自变量或者解释变量,另一个变量则称为因变量或者反应变量。
二变量数据可视化
散点图或者散布图,描述二变量数据。
散点图显示出数据对之间的相关性。
相关关系与因果关系
两个变量存在相关关系并不一定意味着一个变量会影响另一个变量,也不意味着二者存在实际关系。
用最佳拟合线预测数值
能最好地接近所有数据点的线被称为最佳拟合线。
误差最小化
误差平方和
最小二乘回归总结
用相关系数衡量直线与数据的拟合度
相关系数计算公式
要点
总结
1 回归和相关的概念
2 线性回归的确立
3 最小二乘法的应用
练习
【互动交流】
愿意深入交流的朋友,请给陆勤留言或者加陆勤微信:luqin360。
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!