用R,tidyverse和mlr做机器学习
【R语言】已开通R语言群,五湖四海,天南地北,各行各业,有缘相聚,共享R事,雕刻数据,求解问题,以创价值。喜乐入群者,请加微信号luqin360,或扫描文末二维码,添加为好友,同时附上R-入群。有朋自远方来,不亦乐乎,并诚邀入群,以达相互学习和进步之美好心愿。
2021年,祝大家新年健康、平安和喜乐。
回顾过去的2020年,在R语言方面做了如下功课。
一、阅读了4本书籍,涵盖了R语言与数据可视化、数据分析、数据挖掘和机器学习的内容。这一切都是围绕一个主题:如何利用R语言有效地从数据中学习到知识。
二、认识了一群各行各业的R语言朋友,大家在利用R语言解决各自手头的问题,处理各自领域的数据,同时,大家相互交流、讨论和学习,以形成一个R语言学习和成长的共同体。
三、完成了几个与R语言相关的数据项目,有的是数据分析类项目,有的是学术论文方面任务。在实战中,深刻体会到R语言的强大与灵活,以及R语言可以有效和高效地做数据科学所涉及的方方面面的事情。
四、记录了数篇与R语言学习和总结的文章,有问题的解决方案,有特定领域的方法学习,有阅读书籍的心得与收获笔记等等。通过写文章的方式,让自己实现一种复盘与梳理,让自己对所学、所做、所感,做一个规整与优化。
思索当下的2021年,在R语言方面会拥抱这些事情。
第一、继续阅读R语言相关的书籍,我选择《用R,tidyverse和mlr做机器学习》这本书作为2021年的第一本R语言主题的书籍。
为什么选择这本书?首先,它是一本关于机器学习的书籍,机器学习是我研究和实践的方向,机器学习会在各行各业绽放光彩。新的一年,我需要强化自己的机器学习能力、认知、技术与应用。其次,它使用R语言以及两个强大的包tidyverse和mlr来做机器学习。R语言和tidyverse,我比较熟悉,但是,mlr包,我需要学习它。第三,这本书的内容丰富、条理清晰,包括4部分和1附言,依次是引言、分类、回归、降维和聚类。第一部分引言介绍了机器学习和使用tidyverse包做数据整理与可视化,第二部分和第三部分属于机器学习里面的有监督学习内容,依次是分类与回归,对应了最近邻、逻辑回归、判别算法、朴素贝叶斯、支持向量机、决策树、随机森林和boosting、GLM算法、带有正则技术的Ridge、LASSO和Elastic Net算法等;第四部分和第五部分属于机器学习里面的无监督学习内容,依次是降维与聚类,对应了主成分分析、t-SNE和UMAP、SOM和LLE算法、K均值、层次聚类、密度聚类等算法,附录部分回顾和复习一系统计学概念与知识。
这本书籍是英文版,我正在阅读中。
你可以识别下方二维码,进入公众号回复数字“20210101”,获取用R,tidyverse和mlr做机器学习英文电子书!
第二、继续利用R语言做数据相关的事情。包括手头上面的数据分析任务和工作,数据科研任务与项目。
第三、继续认识R语言的朋友们,聚合群体智慧,在R这个生态下,共同成长。
第四、继续写点R语言相关的文章,有可能是总结,有可能是好东西分享,有可能一些动态。比方说,今天分享,我2021年正在阅读第一本R语言书籍,感觉还不错。
朋友们,可以扫描我的微信号,备注“R-入群”。我会邀请你加入R语言群,咱们一起讨论与学习。
R书籍推荐
公众号推荐
数据科学与人工智能
数据科学与人工智能公众号推广Python语言,数据科学与人工智能的知识和信息。扫码下方二维码关注我,一起学习Python语言和数据科学与人工智能。
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!