【数据管理】拥抱 Tidyverse包
笔者邀请您,先思考:
1 您使用tidyverse包?
2 您如何做数据管理?
Hadley Wickham是R for Data Science的合著者(与Garrett Grolemund合作)和RStudio首席科学家的,他将R软件包的大部分开发重点放在数据科学过程的非性感但极为重要的部分:数据管理。在整洁工具宣言中,他提出了处理数据的任何计算机接口的四个基本原则:
-
重用现有的数据结构。
-
用管道组成简单的功能。
-
拥抱函数式编程。
-
为人类设计。
这些原则是在他的R软件包的新集合中实现的:tidyverse。现在,通过简单地调用库(tidyverse)(在从CRAN安装软件包之后),您可以加载一套工具,以便将数据更容易地管理到R会话中:
-
readr,用于从文件导入数据
-
tibble,数据框的现代迭代
-
tidyr,用于重新排列分析数据
-
dplyr,用于过滤,排列,子集,修改和聚合数据框
tidyverse还加载purrr用于数据的函数式编程和ggplot2用于数据可视化。
安装tidyverse软件包也会为您安装(但不会自动加载)其他软件包,以帮助您处理日期/时间,字符串,因素(使用新的forcats软件包)和统计模型。它还提供了用于连接远程数据源和数据文件格式的各种软件包。
简而言之,tidyverse将一套完整的现代数据处理工具放入您的R会话中,并为使用R的任何数据科学家提供一个基本工具箱。(另外,将库(tidyverse)简单添加到您的R脚本而不是之前需要的大量库(…)调用!)Hadley定期更新这些包,并且可以使用提供的tidyverse_update()函数轻松地在R安装中更新它们。
要获得更多关于Tidyverse的内容,请查看下面链接的RStudio博客上的Hadley的帖子。
RStudio博客:tidyverse 1.0.0
原文链接:
https://www.r-bloggers.com/welcome-to-the-tidyverse/
版权声明:作者保留权利,严禁修改,转载请注明原文链接。
您有什么见解,请留言。
加入数据圈子或者商务合作,请添加笔者微信。
数据人网是数据人学习、交流和分享的平台http://shujuren.org 。专注于从数据中学习到有用知识。
平台的理念:人人投稿,知识共享;人人分析,洞见驱动;智慧聚合,普惠人人。
您在数据人网平台,可以1)学习数据知识;2)创建数据博客;3)认识数据朋友;4)寻找数据工作;5)找到其它与数据相关的干货。
我们努力坚持做原创,聚合和分享优质的省时的数据知识!
我们都是数据人,数据是有价值的,坚定不移地实现从数据到商业价值的转换!
点击阅读原文,进入数据人网,获取数据知识。
公众号推荐:
区块链传达,专注于分享区块链内容。
脚印英语,专注于分享英语口语内容。
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!