R语言做数据科学3本电子书
专题介绍:R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户的界面体验更好)。也正是由于全世界越来越多的数据科学社区和用户对R包的慷慨贡献,让R语言在全球范围内越来越流行。其中一些R包,例如MASS,SparkR, ggplot2,使数据操作,可视化和计算功能越来越强大。R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX、Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统,相比于其他统计分析软件,R的学术性开发比较早,适合生物学和医学等学术学科的科研人员使用。
这是我的第83篇原创文章,关于R语言和数据科学。
阅读完本文,你可以知道:
1 R语言做数据科学的3本英文电子书
“PDFMV框架是问题-数据-特征-模型-价值五个英文字母的首字母组合而成,它是以问题为导向,数据为驱动,利用特征和模型从数据中学习到知识,以创造价值的系统化过程。”
1 背景
R语言 适合做数据科学的工作。一个数据科学工作流,如下图所示。
它包括数据获得,数据准备,数据探索,数据分析和建模,数据可视化的工作,R语言都可以胜任这些工作。我总结的PDFMV框架,一个数据工作的方法论,一种以问题为导向,数据为驱动,利用特征和模型从数据中学习到知识,以创造价值的系统化过程,R语言也能够做PDFMV框架下各项事情。
如何掌握R语言做数据科学工作的技能?一方面,根据数据科学工作流中的环节,选择相应的主题学习,我在前面推送的一系列R语言书籍,如下所示:
涵盖了数据可视化,数据分析,统计学,数据挖掘和机器学习等主题。另一方面,直接阅读R语言做数据科学相关的书籍,我在本文推送3本R语言做数据科学的书籍,请参照我的阅读建议,选择合适的书籍阅读和应用。
2 R语言做数据科学书籍
-
1:Practical Data Science With R
-
2:R For Data Science Import,Tidy,Transform,Visualize and Mode Data
-
3:R Data Science Quick Reference
温馨提示:以上书籍,仅供学习使用。
3 阅读建议
我的阅读建议如下。
-
1: 若你想全面地学习如何使用R语言完成数据科学工作流各个环节的任务,请你阅读第二本书。这是一本经典的R语言做数据科学的书籍,分享了R语言和相关R包完成数据导入,整理,变换,可视化和模型等这些方面的任务。
-
2: 若你想了解数据科学的实用性和数据科学对各行业的影响和作用,请你阅读第一本书。这本书介绍了很多行业里面的数据项目案例,以案例为导向,启发我们如何开展数据科学思索和工作。
-
3: 若你想了解做数据科学的工作需要使用到那些R包,请你阅读第三本书。正如书名所言,它是一本数据科学的参考书,把数据科学各环节中重要的R包做了索引和介绍,比方说函数编程的purrr,数据管理的dplyr,管道操作的magrittr,数据导入的readr,字符串处理的stringr,日期和时间操作的lubridate等等。
-
4: 若你是学生或者有足够的时间,我建议你把这三本书的都看下,看的顺序,第二本—第一本—第三本。你在阅读的过程中,以数据科学工作流为导向图,进行学习和实践,一定要把书本的代码做复现,重构和迁移。
4 书籍获取
需要书籍的朋友,请扫码添加我的微信,回复【实名+职业或者专业】,我会告诉你怎么获取书籍,同时,也会邀请你加入我们的R语言圈子。
关于R语言做数据科学的书籍,你有什么问题,请留言。
我是数据人王路情,做着数据工作,也喜欢写点东西,给大家分享一些有用信息和内容。愿朋友们喜欢。
我的微信视频号已经开通一段时间了,每天坚持至少分享一个视频,利用一分钟之内的时间,传播一个有用的数据知识,包括大数据A-Z系列,大话人工智能系列,PDFMV框架系列,R语言小知识系列,数据科学小技巧系列等内容。我在玩视频号的过程中,也在学习和改进短视频的录制和编辑。欢迎你扫码进入我的微信视频号,与我一起学习数据知识,也请你关注,转发和分享。
PDFMV框架系列文章
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!