【数据科学】R语言sqldf包对数据框做SQL操作
R语言sqldf包的sqldf()描述
sqldf()函数:
SQL select on Data Frames
即SQL选择数据框。
关于sqldf包中的sqldf()函数,举例说明。
-
> library(sqldf)
-
> newdf <- sqldf("select * from mtcars where carb=1 order by mpg",row.names = TRUE)
-
> newdf
-
mpg cyl disp hp drat wt qsec vs am gear carb
-
Valiant 18.1 6 225.0 105 2.76 3.460 20.22 1 0 3 1
-
Hornet 4 Drive 21.4 6 258.0 110 3.08 3.215 19.44 1 0 3 1
-
Toyota Corona 21.5 4 120.1 97 3.70 2.465 20.01 1 0 3 1
-
Datsun 710 22.8 4 108.0 93 3.85 2.320 18.61 1 1 4 1
-
Fiat X1-9 27.3 4 79.0 66 4.08 1.935 18.90 1 1 4 1
-
Fiat 128 32.4 4 78.7 66 4.08 2.200 19.47 1 1 4 1
-
Toyota Corolla 33.9 4 71.1 65 4.22 1.835 19.90 1 1 4 1
-
-
> newdf <- sqldf("select avg(mpg) as avg_mpg, avg(disp) as avg_disp,gear from mtcars where cyl in (4, 6) group by gear")
-
> newdf
-
avg_mpg avg_disp gear
-
1 20.33333 201.0333 3
-
2 24.53333 123.0167 4
-
3 25.36667 120.1333 5
说明:
1 sqldf包是R扩展包,需要先安装后加载,才能使用。
2 使用sqldf函数,需要掌握SQL语句的写法。
3 关于sqldf函数更多用法,参阅该函数的文档和实例。
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!