统计推断与数据科学,moderndive和tidyverse包
专题介绍:R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户的界面体验更好)。也正是由于全世界越来越多的数据科学社区和用户对R包的慷慨贡献,让R语言在全球范围内越来越流行。其中一些R包,例如MASS,SparkR, ggplot2,使数据操作,可视化和计算功能越来越强大。R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX、Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统,相比于其他统计分析软件,R的学术性开发比较早,适合生物学和医学等学术学科的科研人员使用。
【R语言】已开通R语言社群,五湖四海,天南地北,各行各业,有缘相聚,共享R事,雕刻数据,求解问题,以创价值。喜乐入群者,请加微信号luqin360,或扫描文末二维码,添加为好友,同时附上R-入群。有朋自远方来,不亦乐乎,并诚邀入群,以达相互学习和进步之美好心愿。
R语言功能强大,应用广,受益于各行各业人才贡献的R包。tidyverse包是我经常使用的R包。它是一个数据科学工作套件,集成了一系列R包,可以完成数据科学工作各项任务。例如,数据的获取,数据的整理,数据分析,数据可视化等。你成功加载tidyverse包后,意味着一系列包都可以使用了(包里面函数集),如下图所示:
最近,在网上发现一本书,如下图:
我在读这本书的英文电子书,记录下读书心得和收获。
第一,这本书主题鲜明,容易读懂。它首先介绍R做数据的准备工作,回答3个问题,分别是1)R和RStudio是什么?2)R中怎么编码?3)R包是什么?然后,用3部分依次介绍三大主题,分别是1)用tidyverse包做数据科学;2)用moderndive包做数据模型;3)用infer包做统计推断,最后,做了个总结。利用数据讲故事,分享了两个案例,很有意思。书籍还提供了两个附录,分别是统计基础知识和本书用到的R包的版本信息和参考文献。以上就是这本书的内容提要。这本书的组织结构,如下图所示:
第二,读这本书,我的几个收获。1)对于tidyverse包数据科学的事情做了强化;2)对统计推断里面介绍的抽样、置信区间和假设检验,有了新的认识,并且学习使用新的包infer来完成这些任务;3)这本书里面介绍的模型属于回归类的模型,让自己又复习了回归相关的算法和用法,并且学习新的R包moderndive来做数据建模的工作;4)用数据讲故事,对我很有吸引力。这是我们做数据工作的人需要强化和提升的软实力,即如何把从数据中学习到东西分享给相关人,以发挥数据的价值,这是非常重要的事情和任务。
第三,这是一本英文电子书,有一段时间没有阅读英文电子书了。趁着阅读这本书的时候,又复习和回顾一下自己的英语知识。英语是一门国际语言,利用它获取信息,或者最新的信息,有助于我们更好地工作和思考。身边有些朋友,一看到是英文书籍,就有一种畏惧感了。我觉得大可不必。这本英文书籍,英语句子都很简单,读起来就很轻松易懂,对于一些不知道的英语,借助一些英语翻译工具和自己的专业知识,就可以很快地理解和弄明白了。期待更多伙伴们,一起来阅读这本书。在读书的过程中有什么想法,请留言或者加入R语言群,大家交流。
可以识别下方二维码,回复数字“20201227”,获取统计推断与数据科学英文电子书!
你在阅读这本书的过程中,遇到什么问题,或者有什么心得与收获,可以扫描我的微信号,备注“R-入群”。我会邀请你加入R语言群,和大家一起讨论与学习。
R书籍推荐
公众号推荐
数据科学与人工智能
数据科学与人工智能公众号推广Python语言,数据科学与人工智能的知识和信息。扫码下方二维码关注我,一起学习Python语言和数据科学与人工智能。
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!