• 主页
  • 课程

    关于课程

    • 课程归档
    • 成为一名讲师
    • 讲师信息
    教学以及管理操作教程

    教学以及管理操作教程

    ¥1,000.00 ¥100.00
    阅读更多
  • 特色
    • 展示
    • 关于我们
    • 问答
  • 事件
  • 个性化
  • 博客
  • 联系
  • 站点资源
    有任何问题吗?
    (00) 123 456 789
    weinfoadmin@weinformatics.cn
    注册登录
    恒诺新知
    • 主页
    • 课程

      关于课程

      • 课程归档
      • 成为一名讲师
      • 讲师信息
      教学以及管理操作教程

      教学以及管理操作教程

      ¥1,000.00 ¥100.00
      阅读更多
    • 特色
      • 展示
      • 关于我们
      • 问答
    • 事件
    • 个性化
    • 博客
    • 联系
    • 站点资源

      R语言

      • 首页
      • 博客
      • R语言
      • 【数据挖掘】十大经典数据挖掘算法R语言实践(三)

      【数据挖掘】十大经典数据挖掘算法R语言实践(三)

      • 发布者 weinfoadmin
      • 分类 R语言
      • 日期 2015年8月4日
      测试开头

      陆勤

      续《十大经典数据挖掘算法R语言实践(二)》,本文中介绍朴素贝叶斯算法在R语言中如何使用。

      数据集,采用R语言内置的iris数据集。

      #查看数据集前六个观测
      head(iris)

      Sepal.Length

      Sepal.Width

      Petal.Length

      Petal.Width

      Species

      5.1

      3.5

      1.4

      0.2

      setosa

      4.9

      3.0

      1.4

      0.2

      setosa

      4.7

      3.2

      1.3

      0.2

      setosa

      4.6

      3.1

      1.5

      0.2

      setosa

      5.0

      3.6

      1.4

      0.2

      setosa

      5.4

      3.9

      1.7

      0.4

      setosa

      朴素贝叶斯算法R代码

      第一步:加载包e1071

      library(e1071)
      library(printr)


      第二步:iris数据集分为训练集和测试集

      index <-sample(1:nrow(iris), 100)
      iris.train <-iris[index, ]
      iris.test <-iris[-index, ]


      第三步:利用朴素贝叶斯算法构建模型

      model.NaiveBayes <-naiveBayes(x =subset(iris.train,select=-Species), y= iris.train$Species)


      第四步:用模型对测试集做测试

      results.NaiveBayes <-predict(object = model.NaiveBayes, newdata =iris.test, type="class")


      第五步:混淆矩阵

      table(results.NaiveBayes, iris.test$Species)

      results.NaiveBayes/

      setosa

      versicolor

      virginica

      setosa

      18

      0

      0

      versicolor

      0

      15

      1

      virginica

      0

      0

      16


      朴素贝叶斯算法思想

      贝叶斯分类的基础是概率推理,就是在各种条件的存在不确定,仅知其出现概率的情况下,如何完成推理和决策任务。概率推理是与确定性推理相对应的。而朴素贝叶斯分类器是基于独立假设的,即假设样本每个特征与其他特征都不相关。


      贝叶斯分类器特点

      1、需要知道先验概率,先验概率是计算后验概率的基础。在传统的概率理论中,先验概率可以由大量的重复实验所获得的各类样本出现的频率来近似获得,其基础是“大数定律”,这一思想称为“频率主义”。而在称为“贝叶斯主义”的数理统计学派中,他们认为时间是单向的,许多事件的发生不具有可重复性,因此先验概率只能根据对置信度的主观判定来给出,也可以说由“信仰”来确定。

      2、按照获得的信息对先验概率进行修正在没有获得任何信息的时候,如果要进行分类判别,只能依据各类存在的先验概率,将样本划分到先验概率大的一类中。而在获得了更多关于样本特征的信息后,可以依照贝叶斯公式对先验概率进行修正,得到后验概率,提高分类决策的准确性和置信度。

      3、分类决策存在错误率由于贝叶斯分类是在样本取得某特征值时对它属于各类的概率进行推测,并无法获得样本真实的类别归属情况,所以分类决策一定存在错误率,即使错误率很低,分类错误的情况也可能发生。


      参考资料

      1 《数据挖掘导论》和《数据挖掘:概念与技术》

      2 数据挖掘十大经典算法(详解)

      3 Top10 data mining algorithms in plain R


      中国数据人QQ群:290937046,使命:让更多人懂数据、用数据。陆勤微信:luqin360 ,多交流。


      测试结尾

      请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!

      • 分享:
      作者头像
      weinfoadmin

      上一篇文章

      【数据挖掘】十大经典数据挖掘算法R语言实践(二)
      2015年8月4日

      下一篇文章

      十大经典数据挖掘算法R语言实践(四)
      2015年8月6日

      你可能也喜欢

      3-1665801675
      R语言学习:重读《R数据科学(中文版)》书籍
      28 9月, 2022
      6-1652833487
      经典铁死亡,再出新思路
      16 5月, 2022
      1-1651501980
      R语言学习:阅读《R For Everyone 》(第二版)
      1 5月, 2022

      搜索

      分类

      • R语言
      • TCGA数据挖掘
      • 单细胞RNA-seq测序
      • 在线会议直播预告与回放
      • 数据分析那些事儿分类
      • 未分类
      • 生信星球
      • 老俊俊的生信笔记

      投稿培训

      免费

      alphafold2培训

      免费

      群晖配置培训

      免费

      最新博文

      Nature | 单细胞技术揭示衰老细胞与肌肉再生
      301月2023
      lncRNA和miRNA生信分析系列讲座免费视频课和课件资源包,干货满满
      301月2023
      如何快速批量修改 Git 提交记录中的用户信息
      261月2023
      logo-eduma-the-best-lms-wordpress-theme

      (00) 123 456 789

      weinfoadmin@weinformatics.cn

      恒诺新知

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      链接

      • 课程
      • 事件
      • 展示
      • 问答

      支持

      • 文档
      • 论坛
      • 语言包
      • 发行状态

      推荐

      • iHub汉语代码托管
      • iLAB耗材管理
      • WooCommerce
      • 丁香园论坛

      weinformatics 即 恒诺新知。ICP备案号:粤ICP备19129767号

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      要成为一名讲师吗?

      加入数以千计的演讲者获得100%课时费!

      现在开始

      用你的站点账户登录

      忘记密码?

      还不是会员? 现在注册

      注册新帐户

      已经拥有注册账户? 现在登录

      close
      会员购买 你还没有登录,请先登录
      • ¥99 VIP-1个月
      • ¥199 VIP-半年
      • ¥299 VIP-1年
      在线支付 激活码

      立即支付
      支付宝
      微信支付
      请使用 支付宝 或 微信 扫码支付
      登录
      注册|忘记密码?