【R包推介】data.table包
陆勤(微信:luqin360)
data.table是data.frame的增强版,它继承和强化了data.frame。
It offers fast subset, fast grouping, fast update, fast ordered joins and list columns in a short and flexible syntax, for faster development.It is inspired by A[B] syntax in R where A is a matrix and B is a 2-column matrix. Since a data.table is a data.frame, it is compatible with R functions and packages that only accept data.frame.
data.table的学习方法
-
查看data.table的帮助文档
help("data.table")
-
the 10 minute quick guide to data.table
vignette("datatable-intro")
-
查看和运行data.table的实例
example("data.table")
Creation
用data.frame()函数创建一个数据框data.frame
set.seed(20) DF <- data.frame(x=c("b","b","b","a","a"), v=rnorm(5))
或者
用data.table()函数创建上述数据框
set.seed(20) DT <- data.table(x=c("b","b","b","a","a"), v=rnorm(5))
利用data.table()函数把一个data.frame轻易转换成data.table.
CARS <- data.table(cars) head(CARS)
代码结果
mpg cyl disp hp
1: 21.0 6 160 110
2: 21.0 6 160 110
3: 22.8 4 108 93
4: 21.4 6 258 110
5: 18.7 8 360 175
Key
第一步:无key选取第二行
DT[2,]
第二步:设置key,利用setkey()函数
setkey(DT, x)
第三步:基于key获取感兴趣行
DT["b", ]
Group
分组求和
DT[, sum(v), by=x]
参考资料
1 data.table10分钟入门
2 data.table的帮助文档
陆勤微信:luqin360
中国数据人QQ群:290937046
数据人R语言QQ群:484784338
数据人PythonQQ群:434146007
学习、交流、分享!
小编祝朋友们国庆快乐,身体安康。愿朋友们懂数据、用数据,做明智决策,过幸福生活!
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!