面试|R语言面试问题集1
编者按:【R语言面试问题集】是从网络上面收集和整理R的语言面试过程中基础的重要的问题集。通过这些问题的学习与解答,一来作为R语言知识掌握的检测,二来感受R语言在各方面的应用。您遇到什么R语言面试问题集?请给我留言。我创建了R语言微信群,定位是R语言学习与实践,需要入群的朋友,请添加我的微信:luqin360,备注:R语言入群。
以下是你需要准备的R语言面试问题和参考答案答案。这个文章涵盖了你在R的面试中可能会问到重要问题。这些R的面试问题将使你在数据分析市场中处于优势,在这个市场中,全球和当地的企业,无论大小,都在寻找具有R认证专业知识的专业人士。
R是一种编程语言,它可以像您希望的那样有用。它是您可以随意使用的工具,可以用于多种目的,如统计分析、数据可视化、数据操作、预测建模、预测分析等等。R被谷歌、Facebook和Twitter等顶级公司使用。
R语言面试问题集1
1 R中有哪些不同的数据结构?简要解释一下。
广义来说,这些数据结构在R中可用:

2 如何在R中加载.csv文件?
在R中加载.csv文件非常简单。
您只需使用“read.csv()”函数并指定文件的路径。
house<-read.csv("C:/Users/John/Desktop/house.csv")
3 图形语法的不同组成部分是什么?
广义来说,这些是图形语法的不同组成部分:
-
数据层
-
美学层
-
几何层
-
面板层
-
坐标系统层
-
主题层
4 Rmarkdown是什么?它有什么用呢?
RMarkdown是R提供的一个报告工具,在RMarkdown的帮助下,您可以为R代码创建高质量的报告。
Rmarkdown的输出格式为:
-
HTML
-
PDF
-
WORD
5 如何在R中安装包?
下面的命令用于在R中安装包:
install.packages (“< package_name >”)
让我们看一个例子。

6 在R中建立和评估线性回归模型的步骤是什么?
以下是建立线性回归模型时需要遵循的顺序步骤:
1 首先将数据划分为训练集和测试集,这一步非常重要,因为您将在训练集上构建模型并评估它在测试集上的性能。
您可以使用“catools”包中的sample.split()函数来实现这一点。这个函数提供了一个split-ratio选项,您可以根据需要指定该选项。

2 一旦您完成了将数据分解为训练集和测试集,您就可以继续在训练集上构建模型了。“lm()”函数用于构建模型。
3 最后,您可以使用“predict()”函数预测测试集中的值。

4 最后一步是计算RMSE, RMSE值越低,预测效果越好。

7 在R中列出一些可以用于数据插补的包?
这些是R中的一些包,可以用来进行数据插补
-
MICE
-
Amelia
-
missForest
-
Hmisc
-
Mi
-
imputeR
8 解释R中的混淆矩阵?
一个混淆矩阵可以用来评估所建立模型的准确性。它计算观察类和预测类的交叉列表。这可以使用“caTools”包中的“confusionmatrix()”函数来完成。

这里,我们创建了一个混淆矩阵,它给出了“实际”和“预测”值的列表。
9 如何在R中编写自定义函数?给一个例子。
这是在R中编写自定义函数的语法:
—
—
—
}
让我们看一个在R中创建自定义函数的例子
fun1<-function(x){ ifelse(x>5,100,0) }
v<-c(1,2,3,4,5,6,7,8,9,10)
fun1(v)->v
10 列出“dplyr”包中可用的一些函数。
dplyr包可用函数:
-
filter
-
select
-
mutate
-
arrange
-
count
11 如何创建一个新的R6类?
我们必须首先创建一个对象模板,它由类中出现的“数据成员”和“类函数”组成。
一个R6对象模板由这些部分组成
-
类名
-
私有数据成员
-
公共成员函数
让我们通过代码来理解对象模板

上述代码由以下部分组成:
-
类名-“Employee”
-
私有数据成员——“名称”和“指定”
-
公共成员函数- ” set_name() ” & ” set_design”
12 什么是随机森林?如何在R中构建和评估随机森林?
随机森林是一种使用多颗决策树模型的集成分类器。它结合了许多决策树模型的结果,这个结果通常比任何单个模型的结果都好。
我们将处理“birth”数据集,其中包括以下列:

让我们在此基础上建立一个随机森林模型来预测“smoke”列,即母亲是否吸烟。
我们先把数据分成训练和测试两部分

在训练集上建立随机森林模型
randomForest(smoke~.,birth)->mod1
现在,我们用模型来预测测试集
predict(mod1,test)->result
13 跟我说说shinyR吧。
shiny是一个R包,可以很容易地直接从R构建交互式web应用程序。您还可以使用CSS主题、htmlwidgets和JavaScript动作来扩展您的shiny应用程序。
14 在R中使用应用apply函数族有什么好处?
apply函数族允许我们对数据框和矩阵进行逐项更改。
R的用法如下:
apply(X, MARGIN, FUN, …)
这里
X是一个数组或矩阵
MARGIN是一个变量,它决定函数是应用于行(MARGIN=1)、列(MARGIN=2),还是同时应用于行和列(MARGIN=c(1,2))
FUN是要应用的函数。
如果MARGIN=1,函数接受X的每一行作为向量参数,并返回结果的向量。同样,如果MARGIN=2,函数作用于X的列。最令人印象深刻的是,当MARGIN=c(1,2)时,函数作用于X的每一项。
优势:
使用apply函数,我们可以用一行命令编辑数据帧的每个条目。没有自动填充,没有浪费CPU周期。
15 在R中什么包用于数据挖掘?
R中用于数据挖掘的一些包:
-
data.table-提供快速读取大文件
-
rpart和caret-用于机器学习模型
-
Arules-用于关联规则
-
ggplot-用于数据可视化
-
tm-用户文本挖掘
-
forecast-用户时间序列分析
原文链接:
https://www.edureka.co/blog/interview-questions/r-interview-questions/
你若是觉得有用,清点赞并分享给其它朋友。更多数据知识,请点击阅读原文。您有任何问题,请留言。
内容推荐
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!