• 主页
  • 课程

    关于课程

    • 课程归档
    • 成为一名讲师
    • 讲师信息
    alphafold2培训

    alphafold2培训

    免费
    阅读更多
  • 特色
    • 展示
    • 关于我们
    • 问答
  • 事件
  • 个性化
  • 博客
  • 联系
  • 站点资源
    有任何问题吗?
    (00) 123 456 789
    weinfoadmin@weinformatics.cn
    注册登录
    恒诺新知
    • 主页
    • 课程

      关于课程

      • 课程归档
      • 成为一名讲师
      • 讲师信息
      alphafold2培训

      alphafold2培训

      免费
      阅读更多
    • 特色
      • 展示
      • 关于我们
      • 问答
    • 事件
    • 个性化
    • 博客
    • 联系
    • 站点资源

      R语言

      • 首页
      • 博客
      • R语言
      • 【机器学习】监督学习之一元多项式回归和多元线性回归

      【机器学习】监督学习之一元多项式回归和多元线性回归

      • 发布者 weinfoadmin
      • 分类 R语言
      • 日期 2015年10月28日
      测试开头

      一元线性回归假定了因变量与自变量是线性的(即因变量和自变量的关系可以用一条直线来近似表示),然而这种关系也可能是非线性的,此时就需要用到多项式回归;或是因变量受到多个自变量的影响,这时就需要多元线性回归。

      一元多项式回归

      多项式回归是使用一个因变量与一个或多个自变量多项式的回归分析方法,来建立非线性模型,从一定角度来讲,多项式回归可算作多元线性回归的一个特例。

      在R中,拟合一元多项式回归函数也是lm(),参数相同,有区别的地方在于formula的形式设定。

      lm(formula, data)

      比如一个三阶一元多项式回归的formula是这个样子的:

      y~x1+I(x1^2)+I(x1^3)

      备注:I()为R中表达式另一个常用符号,用来从算数的角度来解释括号中的元素。例如:y~x+(z+w)^2展开为y~x+z+w+z:w。相反,y~x+I((z+w)^2)将展开为y~x+z^2+w^2+2wz。

      >>> 示例

      某单位对12名女工进行体检,体检项目包括体重(W/kg)和肺活量(L/L),数据如下,试建立肺活量(因变量)与体重(自变量)的回归模型。:

      【机器学习】监督学习之一元多项式回归和多元线性回归
      如果要建立一个二阶多项式回归模型,其步骤如下:

      【机器学习】监督学习之一元多项式回归和多元线性回归

      作图看一下拟合的效果如何:

      【机器学习】监督学习之一元多项式回归和多元线性回归
      【机器学习】监督学习之一元多项式回归和多元线性回归
      多元线性回归

      多元线性回归是指在回归分析中,有两个或两个以上的自变量,它常常由多个自变量的最优组合共同来预测或估计因变量,而实际生活中一种现象通常不是一个因素决定的,例如消费水平会受到工资水平、受教育程度、家庭负担等因素的影响,而多元回归能够将多个自变量对因变量的影响描述出来,因而有着极其广泛的应用。

      >>> 示例

      现测量了 30 名被怀疑患有动脉硬化的就诊患者的载脂蛋白AI(X1)、载脂蛋白 B (X2)、载脂蛋白 E(X3) 、载脂蛋白 C(X4) 、低密度脂蛋白(Y)中的胆固醇含量(单位:mg/dl),资料如下表所示,试构建Y关于X1,X2,X3,X4的回归方程。

      【机器学习】监督学习之一元多项式回归和多元线性回归
      注:示例数据较多,未完全截取,需要获取源数据进行练习的话,可以回复关键字下载。

      【机器学习】监督学习之一元多项式回归和多元线性回归
      【机器学习】监督学习之一元多项式回归和多元线性回归
      重要的是如何解释这个模型:

      ⊙ 上图中告诉我们模型构建了这样的方程,

      Y=-0.829+0.2331X1+1.3251X2-0.1243X3-2.3853X4

      换种说法是,以载脂蛋白B(X2)为例,在其他自变量不变时,载脂蛋白B升高1mg/dl,低密度脂蛋白就升高1.3251mg/dl;

      ⊙ 通过模型参数的检验来看,载脂蛋白B(X2)和载脂蛋白 C(X4)的系数与0有显著性差异,即这两者对低密度脂蛋白有显著性影响;

      ⊙ 相关指数告诉我们这个模型可以解释低密度脂蛋白56%的方差。


      拓展延伸

      ⊙ R中自带数据集state.x77,它提供了一个州的犯罪率和其他因素的关系包括人口、文盲率、平均收入和结霜天数,有兴趣的读者可以操作尝试。

      ⊙ 如果有交互项的回归分析,应该如何拟合模型?


      推荐公众号:数据科学自媒体

      微信号:DataScienceWeMedia

      这里都是分享数据科学的好东东哦

      数据科学自媒体,专注数据科学的好东西。

      【机器学习】监督学习之一元多项式回归和多元线性回归
      长按图片,识别二维码,关注我们。



      测试结尾

      请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!

      • 分享:
      作者头像
      weinfoadmin

      上一篇文章

      【机器学习】监督学习之神经网络
      2015年10月28日

      下一篇文章

      【机器学习】监督学习之随机森林
      2015年10月29日

      你可能也喜欢

      3-1665801675
      R语言学习:重读《R数据科学(中文版)》书籍
      28 9月, 2022
      6-1652833487
      经典铁死亡,再出新思路
      16 5月, 2022
      1-1651501980
      R语言学习:阅读《R For Everyone 》(第二版)
      1 5月, 2022

      搜索

      分类

      • R语言
      • TCGA数据挖掘
      • 单细胞RNA-seq测序
      • 在线会议直播预告与回放
      • 数据分析那些事儿分类
      • 未分类
      • 生信星球
      • 老俊俊的生信笔记

      投稿培训

      免费

      alphafold2培训

      免费

      群晖配置培训

      免费

      最新博文

      白介素-17受体信号的自主激活,维持炎症并促进疾病进展
      048月2023
      MCT4依赖的乳酸分泌抑制LKB1缺陷肺腺癌的抗肿瘤免疫
      187月2023
      Nature | 单细胞技术揭示衰老细胞与肌肉再生
      301月2023
      logo-eduma-the-best-lms-wordpress-theme

      (00) 123 456 789

      weinfoadmin@weinformatics.cn

      恒诺新知

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      链接

      • 课程
      • 事件
      • 展示
      • 问答

      支持

      • 文档
      • 论坛
      • 语言包
      • 发行状态

      推荐

      • iHub汉语代码托管
      • iLAB耗材管理
      • WooCommerce
      • 丁香园论坛

      weinformatics 即 恒诺新知。ICP备案号:粤ICP备19129767号

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      要成为一名讲师吗?

      加入数以千计的演讲者获得100%课时费!

      现在开始

      用你的站点账户登录

      忘记密码?

      还不是会员? 现在注册

      注册新帐户

      已经拥有注册账户? 现在登录

      close
      会员购买 你还没有登录,请先登录
      • ¥99 VIP-1个月
      • ¥199 VIP-半年
      • ¥299 VIP-1年
      在线支付 激活码

      立即支付
      支付宝
      微信支付
      请使用 支付宝 或 微信 扫码支付
      登录
      注册|忘记密码?