【R资料】R for Data Science
本周是2018年第20周,笔者从本周开始,坚持每周给大家推荐一份有价值的R资料,这些资料的形式包括:书籍,论文,报告,代码,并且提供下载,欢迎大家持续关注,一起来学习,交流和分享。
书籍:《R for Data Science_ Import, Tidy, Transform, Visualize, and Model Data》
一:为什么推荐这本书籍?
这本书是Garrett Grolemund和Hadley Wickham合著的一本介绍R做数据科学的书籍。这本书的组织架构围绕数据科学的工作流程所展开,包括数据的导入,数据管理,数据的可视化,数据建模,数据报告。对于想使用R语言做数据科学或者专注于数据科学里面的某个环节的数据人,强烈推荐阅读和实践。(期待您的读后感)
二:本书的主要内容有哪些?
本书的内容包括四个部分:
第一部分:探索
这部分包括1)ggplot2做数据可视化;2)dplyr做数据变换;3)探索性数据分析;4)工作流:基础,脚本和项目管理
第二部分:整合
这部分包括1)tibble数据结构;2)readr做数据导入;3)tidyr做数据整洁;4)dplyr处理关系型数据;5)stringr做字符串;6)forcats做因子处理;7)lubridate做日期和实践处理
第三部分:编程
这部分包括1)magrittr做管道处理;2)purrr做迭代处理;3)向量和函数
第三部分:建模
这部分包括1)modelr做基本模型;2)模型构建;3)purrr和broom构建更多模型
第四部分:沟通
这本分包括1)R Markdown;2)ggplot2做数据故事;3)R Markdown格式和工作流
三:阅读本书需要什么基础?
小编建议,仅供参考,欢迎补充。
1 掌握R语言基础知识(R的数据类型+R的数据结构+R的控制流程+R的包安装和使用)
2 好奇心,喜欢用数据科学知识解决数据问题
四:如何获取资料?
关注微信公众号,点赞和转发,添加笔者微信,即可获取。
数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习到有用知识。
平台的理念:人人投稿,知识共享;人人分析,洞见驱动;智慧聚合,普惠人人。
您在数据人网平台,可以1)学习数据知识;2)创建数据博客;3)认识数据朋友;4)寻找数据工作;5)找到其它与数据相关的干货。
我们努力坚持做原创,聚合和分享优质的省时的数据知识!
我们都是数据人,数据是有价值的,坚定不移地实现从数据到商业价值的转换!
点击阅读原文,进入数据人网,获取数据知识。
公众号推荐:
区块链传达,专注于分享区块链内容。
脚印英语,专注于分享英语口语内容。
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!