R语言学习:Linux系统安装rJava包,ML实验数据集,查看安装的R包,Shiny书籍,绘制组间均值和置信度图形
2022年第02周。
这一周R语言学习,记录如下。
01
Ubuntu18系统安装rJava包
最近基于Ubuntu18系统的服务器搭建R工作环境时,需要安装rJava包,具体步骤如下:
-
第一步:安装JRE
sudo apt-get install -y default-jre
-
第二步:安装JDK
sudo apt-get install -y default-jdk
-
第三步:配置JAVA_HOME
sudo vi /et/enviroment
配置JAVA_HOME的值
JAVA_HOME = "/usr/lib/jvm/java-11-openjdk-amd64"
让配置文件生效
source /etc/enviroment
-
第四步:重新更新Java配置,方便R语言找到
sudo R CMD javareconf
-
第五步:安装rJava包
sudo Rscript -e 'install.packages("rJava")'
02
用于做机器学习实验的数据集
机器学习就是从数据中学习以改善性能的系统化过程。
数据对于机器学习至关重要。我们可以找到很多领域的,公开的数据集,来做机器学习实验。
我这里给大家推荐3个R包,这些包里面包括很多数据集,可以用它们做机器学习实验。
-
MLDataR包
-
mlbench包
-
dslabs包
安装和加载这些包,以及查看这些包所提供的数据集信息。
if(!require("MLDataR")){
install.packages("MLDataR")
library(MLDataR)
}
if(!require("mlbench")){
install.packages("mlbench")
library(mlbench)
}
if(!require("dslabs")){
install.packages("dslabs")
library(dslabs)
}
data(package="MLDataR")
data(package="mlbench")
data(package="dslabs")
关于这些包里面的数据集理解,一方面可以查看这些数据集的帮助文档,查看他们的元数据(数据集的数据,用于描述数据概述、数据变量的含义等信息),另一方面,可以采用数据理解和探索的方法快速理解这些数据集,同时,进一步思考这些数据集的利用。
03
查看已经安装的R包
R语言的强大,R包功不可没。
我们可以通过这些方法,查看当前的R工作环境已经安装好了那些R包。
-
1 library():查看已经安装包列表,会打开一个新窗口显示信息。
-
2 installed.packages(): 查看各个已经安装的包的路径以及版本号信息。
-
3 .packages(all.available=TRUE): 显示已安装包的名字,只显示包的名称。
library()
installed.packages()
.packages(all.available = TRUE)
04
Top3 Best 的 Shiny 书籍
我在2022年第01周R语言学习里面谈到Shiny包值得你去学习和应用的一个R包。
在这里,给大家分享Top3 Best的在线Shiny书籍。你在学习中有任何问题,请扫描文末二维码,添加我的微信,备注:姓名-入群,可以进群一起讨论。
1 Mastering Shiny by Hadley Wickham
Mastering Shiny这本书的目的是让你从一个绝对的Shiny初学者,到编写大型、复杂但同时可维护和高性能的应用程序。你会学到很多关于响应式元素和响应式编程的知识,这是Shiny的核心概念。这本书还教你如何在Shiny中使用图形、布局和主题,以及如何处理用户反馈。
你可以在R语言群的群公告下载PDF电子书,也可以在线阅读,访问网址如下:
https://mastering-shiny.org/
2 Outstanding User Interfaces With Shiny by David Granjon
这本书是针对那些想要学习更多底层web技术的更有经验的Shiny用户。
如果你想要添加一个更专业和精致的外观,设计令人惊叹的交互式输入小部件,更好地处理JavaScript和CSS,开发移动友好的模板,并在你的Shiny应用程序中包含React,这本书就是为你准备的。
这本书的在线阅读网址:
https://unleash-shiny.rinterface.com/
3 Engineering Production-Grade Shiny Apps by Colin Fay
这本书不是针对R Shiny的初学者。它向你介绍了如何在实际生产中更好创建和应用Shiny程序。
这本书也可以在线访问和阅读,网址如下:
https://engineering-shiny.org/
05
绘制组均值和置信区间
有时候,我们需要分组观察和统计均值和置信度,进行组间对比分析。
我们可使用gplots
包的plotmeans()
函数绘制组均值和置信区间的可视化图形。
在这里,以R语言代码来演示。
library(gplots)
# 数据集
head(ToothGrowth)
glimpse(ToothGrowth)
# 使用plotmeans()函数
?plotmeans
# 可视化1
plotmeans(len ~ dose, data = ToothGrowth, frame = FALSE)
# 可视化2
# Add mean labels (mean.labels = TRUE)
# Remove line connection (connect = FALSE)
plotmeans(len ~ dose,
data = ToothGrowth,
frame = FALSE,
mean.labels = TRUE,
connect = FALSE)
效果图
图形1
图形2
我创建了R语言群,添加我的微信,备注:姓名-入群,我邀请你进群,一起学习R语言。
如果你想学习数据科学与人工智能,请关注下方公众号~
如果你想找数据工作,请关注下方公众号~
如果觉得本文不错,就顺手帮我转发到朋友圈和微信群哦。
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!