绘制多种算法的Accuracy的对比分析可视化
专题介绍:R是一种广泛用于数据分析和统计计算的强大语言,于上世纪90年代开始发展起来。得益于全世界众多 爱好者的无尽努力,大家继而开发出了一种基于R但优于R基本文本编辑器的R Studio(用户的界面体验更好)。也正是由于全世界越来越多的数据科学社区和用户对R包的慷慨贡献,让R语言在全球范围内越来越流行。其中一些R包,例如MASS,SparkR, ggplot2,使数据操作,可视化和计算功能越来越强大。R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个用于统计计算和统计制图的优秀工具。R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX、Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统,相比于其他统计分析软件,R的学术性开发比较早,适合生物学和医学等学术学科的科研人员使用。
问题提出
利用多种算法解决科学问题的时候,记录每种算法在各个采样点下性能指标,比方说Accuracy,如何绘制这些算法的Accuracy的对比分析的可视化呢?
解决方法
第一步:数据导入
# 数据导入
library(readxl)
model_accuracy_data <- read_excel('model_accuracy.xlsx')
# 变量重命名
names(model_accuracy_data) <- c('Sample', 'Model1', 'Model2', 'Model3')
model_accuracy_data
数据检视结果如下图:

第二步:宽数据转换为长数据
library(tidyverse)
model_accuracy_data1 <- model_accuracy_data %>%
gather(key = 'Model', value = 'Accuracy', -Sample)
第三步:数据可视化
ggplot(data = model_accuracy_data1, aes(x = Sample, y = Accuracy)) +
geom_point() +
geom_line(aes(col = Model)) +
theme_classic() +
theme(legend.background = element_rect(fill="lightblue",
size=0.5, linetype="solid",
colour ="darkblue")) +
scale_x_continuous(breaks=model_accuracy_data1$Sample) +
expand_limits(y=c(0, 0.8))
数据可视化结果如下图:

思考题
如何把数据可视化结果保存为高质量可出版的图片?
想找数据工作或者要招数据人才的朋友,或者想了解数据人有趣事情的朋友,可以关注公众号【数据人才】。
想了解数据科学和人工智能的朋友,可以关注公众号【数据科学与人工智能】。
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!