【R读书笔记】R语言读书心得1-进入R
1.数据的导入和基本操作
我相信,各位学习R语言的朋友都应该多少都应该看了《R语言实战》这本书。我个 人认为,《R语言实战》确实是一本适合刚刚接触R语言的朋友学习,同时也适合已经入门的人士把这本精读下来。可以说,如果能把这本书精度下来,最少,我们 使用R的水平必然比以前有了几个层次的提升。
在之前一篇导论中,我已经把这次读书笔记的计划以及架构都已经说的很清楚了,所以这里就不再强调,而是直接进入正题。
在正式进入主题之前,在本书的开头也提到了,我们为什么要选择R作为我们数据分析的入门语言?尽管我之前在给类的文章中我都表态说学什么都没有所谓,但是,由于我刚开始也是从R开始学习的,而现在也还在学习R,所以,我还是推荐大家从R语言入手,其主要原因如下:
-
R是一款免费而且是开源的编程语言,之前看了一下Matlab,Matlab是需要收钱的,而且价格并不菲,除非你是盗版下载它;而R是免费的,我相信,如果你是老师或是学生,其优点是显而易见的。
-
R不止是一门很好的统计学编程语言,而且也是一门容易学习的语言。到目前为止,R语言有7000多个程序包,它们能处理数据科学各个领域的问题,而你只需要调用相关的R包和里面的函数,这时你只需要调用相关函数,而不需要写太多的代码就能解决一个问题,这何乐而不为呢。
-
R是一个很强的交互式数据分析平台。它有很好的数据输入、输出功能,甚至调用自行编写的函数进行数据分析,并保存每一个步骤都是相当的方便,这样的软件使用起来是多么的高效。
-
R语言有强大的可视化功能。在R里,你只要使用ggplot2包并调用里面的函数,就能很好的把基本的统计图像画出来,甚至,你可以按照你的需要把相关图像改成你所需要的效果。这里,我敢保证,它可以帮你作出高质量的统计图像。
1.1下载和安装R
当然,R语言的优势之处还有很多,其它的话你就自行看书了解就可以了。
说完了R语言的优势,或许你已经心动了,决定要学习R语言了。那么,我们现在要做的,就是安装好R语言。
怎么安装R呢?首先,我们需要进入R语言官网:https://www.r-project.org/,这时我们会看到这样的界面:
接下来,我们找到安装的地方,就是Download下面显示的CRAN,点击以后,我们会看到下面的这个界面:
这里,我们选择中国厦门这个镜像,也就是China那里的最后一行,点击以后,我们会进入下面的界面:
这时,我们再选择Download R for Windows这个选项,之后进入到下面的这个界面:
点击第一行的install R for the first time,进入到下面的界面:
只要看到这个链接就可以,点击它就能下载了。
接下来,我也讲一下如何下载Rstudio吧,而且以后的操作主要也是在Rstudio中执行的。安装Rstudio的官网是https://www.rstudio.com/products/rstudio/download/,这时我们就进入到下面的这个界面:
要下载Rstudio的话,我们在这个页面下边找到:
这里,我们看到各种操作系统版本的Rstudio以及相关源代码。这里,大部分的人都是使用Windows操作系统的,所以,我们就直接点击第一行就好了。剩下的限于篇幅,我就不再介绍了。
1.2进入R
我想,你已经成功的安装R了。大家都看到这个界面了吧:
然后,我们点击File->New File->R scrip就能创建一个运行R的环境了。
好了,我们现在就开始我们的R语言之旅。
首先,我们可以随便的打个数字1,有:
我们轻轻松松地打了个1上去。其实,我们也可以在里面输入一串数字,先看看有序的一串数字:
其实,还有以下两种方法也能实施同样的效果,而这里,我们用到c()函数来输入向量,得:
当然,你也可以像你当初学C语言那样定义一个变量来存储这些向量,以后你也可以像C语言那样随机定义一个变量来储存各种数据,如下:
这里,你定义完p以后,再打上p就可以输出里面的内容了。
1.3帮助文档和工作目录设定
当然,我们在学习的过程中,难免遇到一些我们一时无法解决的问题,学习R也不例外。学习R的时候,如果我们不知道某些问题怎样使用一个特定的函数或相关程序包,我们就需要使用帮助文档,常见的有help(),例如,我们想要了解一下矩阵是怎么使用的,如下:
help(matrix)
这里,is.matrix()判断一个变量或参数是否是矩阵,as.matrix()则是把其它形式的变量转换成矩阵的格式。再看看 matrix(),data表示我们需要输入的数据,nrow和ncol分别表示矩阵的行数和列数,byrow可以理解为是一种逻辑运算,它默认情况下把 未填满的矩阵按列填满,否则按行填满,其它的可以自行参照帮助文档里的内容。当然,如果大家发现这里有什么说的不合理的地方,也欢迎大家在最底下的留言板 那里指出具体的错误和正确的表达方法,这样,无论对于我,还是对于你本人都是一个收获的过程。
除了help(),你们也可以参照书本里面的其它帮助函数,它们都有各自的更能,列表如下:
这部分的内容大家就自行理解好了。
接下来,我们讲一下工作目录。在R语言的编程过程中,如果我们想要调用函数读入一些相关的数据文件或文本文件,都需要确认此文件就在工作目录里,否 则,程序会报错说找不到。那么,我们怎么查找我们的工作名录呢?这里,我们需要用到getwd()函数。首先,我拿我自己的电脑为例,看一下我的工作目录 在哪:
getwd()
这里显示,我的工作目录在C盘的Users里的管理里的文档。假如为了方便工作目录,我们可以使用setwd()函数进行更改。下面,我还是以我自己的电脑为例,把工作目录设定到E盘的新建的一个文件夹数据1里,具体过程如下:
setwd()
现在,我们再一次使用getwd,查看是否已经更改到我所设定的目录:
getwd()
这里,我们已经成功的修改了我们的工作目录。因此,以后我们可以把要导入的数据存入这里,然后使用read.table()函数即可。
当然,其它一些函数也能对工作目录进行相关操作,详细如下:
1.4程序包
到目前为止,R语言已经有7000多个系统自带的或者各位R用户所编写的R程序包,而这些包能处理各个领域的问题。因此,这些R包的功能是非常强大的,这也是为什么R现在这么热门的原因。
说到使用程序包,我们首先就得把它调用出来。在R里,我们可以用library()函数进行程序包的调用,而这里,我调用一下过程如下:
Library(ggplot2)
已经成功调用了。现在,我们可以试一下使用里面的函数(以后讲到数据可视化的时候,ggplot2包是重点讲解的),例如,使用qplot()函数 画一个条形图。这里,我们调用一个系统自带的数据集,pressure数据集。首先,我们先help(qplot),其帮助文档内容如下:
我们可以看到,qplot是ggplot2包里的一个作图函数,其作用类似于普通的plot(),就是根据数据集作图。其中,x,y,data这几 个参数必须填,geom代表作哪一类的图像,如果是折线图,则geom=”line”,要作箱图,则geom=”boxplot”,类似的还有很多,以后 讲到可视化的时候会具体讲。
现在,我们就使用qplot()函数简单做一下折线图:
gplot(temperature,pressure,data=pressure,geom=”line”)
当然,如果library()调用以后显示包没有安装,那么,我们首先就要检查一下你是否打错名字,如果没有打错,我们可以试一下install.packages()函数进行包的安装,或者调用系统里面的功能也行,过程如下:
点击install,然后弹出这个界面:
然后你就直接在空白的那一行输入你要安装的包就好了。
当然,你也可以在R×64 3.2.3里进行安装,这时,你需要设定镜像,过程如下:
【程序包】-【设定CRAN镜像】,然后弹出一下界面:
这里,我们可以选择选择最后一行的网络镜像,然后弹出如下界面:
我这里推荐安装中国厦门的镜像,点击以后,镜像就已经设定成功。现在,你就能直接使用install.packages()函数进行安装了。这里,你就直接install.packages(”包名”)就好了,这样,你的包就安装成功了。
何品言,热爱英语和数据科学。
今日数据人网精选推荐:
《美国大学让人工智能做助教,下一个会是什么》
《数据科学》
点击【阅读原文】,立刻阅读精选文章。
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!