超简单的中文数据画图(R语言)
今天是生信星球陪你的第293天
大神一句话,菜鸟跑半年。我不是大神,但我可以缩短你走弯路的半年~
就像歌儿唱的那样,如果你不知道该往哪儿走,就留在这学点生信好不好~
这里有豆豆和花花的学习历程,从新手到进阶,生信路上有你有我!
师姐来找我画图,数据是各地昆虫的某种评价指标,每个地方有94个数,要比较一下其中几个地区之间有无差别。就把他当作一个学习的数据来做,不必理会背后的意义。
原始数据大概是这样,19个地区,94行(当然我已经篡改过),在生信星球公众号回复‘1994’可以获得示例数据,将它放到你的工作目录下,然后来练习。

啊,问题就是要处理中文。给我的地名就是文字,用字符串分割,改上列名。
rm(list = ls())
options(stringsAsFactors = F)
x=read.csv("test.csv");head(x)
zz="云南普洱 江苏泰州 江苏扬州 河北沧州 安徽鞍山 陕西杨凌 湖北武汉 江西南昌 山东夏津 山东烟台 山东东营 河南新乡 河北廊坊 山西原平 内蒙古 辽宁沈阳 吉林长春 黑龙江哈尔滨 新疆石河子"
library(stringr)
col=str_split(zz,"t",simplify = T)
colnames(x)=col
library(tidyr)
tid = gather(x,key = '地名',value='δ13C(‰)')
tid1=tid[tid$`地名` %in% c("云南普洱","江苏泰州","江苏扬州","河北沧州","安徽鞍山","河北廊坊"),]
然后找了一个简单又好看的图
library(ggstatsplot)
ggbetweenstats(data = tid1,
x = `地名`,
y = `δ13C(‰)`,
xlab = "地名")

中文的列名和奇怪的字符,用“给装起来就能用咯。
简书:小洁忘了怎么分身
隔壁生信技能树公益视频合辑(学习顺序是linux,r,软件安装,geo,小技巧,ngs组学!)
国内看B站,教学视频链接:https://m.bilibili.com/space/338686099
国外看YouTube,教学视频链接:https://m.youtube.com/channel/UC67sImqK7V8tSWHMG8azIVA/playlists友情链接:
点击底部的“阅读原文”,获得更好的阅读体验哦😻
初学生信,很荣幸带你迈出第一步。
我们是生信星球,一个不拽术语、通俗易懂的生信知识平台。由于是2018年新号,竟然没有留言功能。需要帮助或提出意见请后台留言、联系微信或发送邮件到Bioplanet520@outlook.com,每一条都会看到的哦~
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!