dplyr和tidyr简介|数据处理
数据处理两大利器:dplyr和tidyr
1 dplyr 简介
dplyr是Hadley Wickham设计,创建和维护的数据处理包。
它提供了一些易于使用,功能强大的函数集,方便对数据进行管理和探索。
dplyr常用函数:
-
select():选择所需列
-
filter():选择所需行
-
mutate():添加新列
-
arrange():改变行的顺序
-
summarise():聚合操作,常与group_by()函数结合使用
-
group_by():分组函数
-
inner_join():内连接操作
-
left_join():左连接操作
-
right_join():右连接操作
2 tidyr简介
tidyr是Hadley Wickham创建用于数据整理的包。它通常与dplyr包结合使用。
tidyr常用函数:
-
gather():宽数据转换为长数据
-
spread():长数据转换为宽数据
参考资料:
1 https://www.rdocumentation.org/packages/dplyr/versions/0.7.3
2 https://www.r-bloggers.com/data-manipulation-with-tidyr/
您在阅读中,关于dplyr和tidyr包有什么见解,请评论。
更多R内容,请阅读原文。
想加入数据人圈子,请加微信luqin360。
文章推荐:
2 R语言做数据探索
3 电商评论情感分析
公众号推荐:
1 数据科学与人工智能,分享数据科学和人工智能的内容。
2 好又乐书屋,分享王阳明|曾国藩|毛泽东的思想,健康、教育的内容,传播正能量。
阅读原文,更多精彩!
分享是收获,传播是价值!
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!