• 主页
  • 课程

    关于课程

    • 课程归档
    • 成为一名讲师
    • 讲师信息
    同等学历教学

    同等学历教学

    免费
    阅读更多
  • 特色
    • 展示
    • 关于我们
    • 问答
  • 事件
  • 个性化
  • 博客
  • 联系
  • 站点资源
    有任何问题吗?
    (00) 123 456 789
    weinfoadmin@weinformatics.cn
    注册登录
    恒诺新知
    • 主页
    • 课程

      关于课程

      • 课程归档
      • 成为一名讲师
      • 讲师信息
      同等学历教学

      同等学历教学

      免费
      阅读更多
    • 特色
      • 展示
      • 关于我们
      • 问答
    • 事件
    • 个性化
    • 博客
    • 联系
    • 站点资源

      未分类

      • 首页
      • 博客
      • 未分类
      • GO富集可视化-GOplot

      GO富集可视化-GOplot

      • 发布者 weinfoeditor
      • 分类 未分类
      • 日期 2019年8月21日
      • 评论 0评论

      之前在生信媛公众看到一篇软文GOplot 可视化基因富集分析结果,刚好我也对一些可视化方法蛮感兴趣,因此学习了下,感觉蛮有意思的,其提出了一些新的GO富集可视化思路;因此在官方提供的测试数据基础上,尝试用下常规的GO富集数据格式

      GOplot使用了zscore概念,其并不是指Z-score标准化,而是用于表示参与某个GO Term下基因的上下调情况,公式:$zscore=\frac{(up-down)}{\sqrt{count}}$

      zscore is an easy to calculate value to give you a hint if the biological process (/molecular function/cellular components) is more likely to be decreased (negative value) or increased (positive value)

      GOplot使用说明可以参照官方文档:https://wencke.github.io/,其对于这个R包的使用讲的非常的详细,看一遍就懂了

      文档使用的是EC数据集,但实际使用中则是各个富集软件来源的结果,因此我们需要对于自己的数据先进行预处理,以满足GOplot调用规则;其有circle_dat函数可以用于整合外来数据,但是要求数据的格式(尤其指列名)规范化,我们可看函数说明或者EC示例文件,模仿着修改

      比如我整理的两个文件:DEG 和 enrichment

      导入数据生成规范格式

      library(GOplot)
      deg <- read.table(file = "../Desktop/DEG.txt", sep = "\t", header = T, stringsAsFactors = F)
      enrich <- read.table(file = "../Desktop/enrichment.txt", sep = "\t", header = T, stringsAsFactors = F)
      circ <- circle_dat(enrich, deg)
      

      接着看下GOplot所能绘制的几类图片,个人觉得可视化展示方法的新意才是值得学习的,至于用什么软件展示则是次要的;当然单纯从美观角度来说,GOplot出具的图片还是可以的

      首先是barplot图,纵坐标是adj.pvalue,横纵标是GO id,通过柱子颜色来展示zscore

      GOBar(circ, display = 'multiple')
      

      GOplot-barplot

      bubble图,以adj.pvalue为纵坐标,zscore为横纵标,对于满足一定阈值(比如log10(adj.pvalue) > 3)的显示GO id(PS.这里的纵坐标写着是log是指log10)

      GOBubble(circ, display = "single", labels = 3, table.legend = F)
      

      GOplot-bubble

      GOplot为了过滤一些比较相似的GO ID(认为是冗余的),其根据不同GO之间参与基因的相似程度进行的过滤,这个可以自己写代码预先过滤下,也可以直接用其写好的函数reduce_overlap

      reduced_circ <- reduce_overlap(circ, overlap = 0.75)
      GOBubble(reduced_circ, labels = 3, table.legend = F)
      

      然后是Circular图,相当有圈圈图,内圈展示zscore,外圈展示GO id,外圈里面则是参与基因的上下调分布情况

      GOCircle(circ, nsub = 10, label.size = 5, rad1 = 3, rad2 = 4, table.legend = F)
      

      GOplot-circle

      还有则是用圈圈图展示gene和go term之间的关系,这需要先用chord_dat函数构建一个对象,其需要circ,deg以及制定的go id等数据;limit参数则是限制基因/GO的数目

      process <- tail(enrich$ID, 10)
      chord <- chord_dat(data = circ, genes = deg, process = process)
      GOChord(chord, space = 0.02, gene.order = 'logFC', gene.space = 0.25, gene.size = 2.5, limit = c(0,2))
      

      GOplot-chord

      接着则是其热图,这张图比较有意思,其以热图展示GO term和gene id,每行是一个GO,每列是一个gene;如果其图例是count的话,其每格的颜色则是该gene参与图中所有go term总数;如果是logFC的话,则比较好理解,是该基因的logFC的值

      GOHeat(chord, nlfc = 1, fill.col = c('red', 'yellow', 'green'))
      

      GOplot-heatmap

      最后还是一个圈圈图,感觉GOplot把圈圈图的一些展现形式都用了个遍,其内圈是根据基因logFCz做的聚类,外圈则是GO term的堆积图

      GOCluster(circ, process, clust.by = 'logFC', term.width = 2)
      

      GOplot-cluster

      GOplot这个R包的一些展示形式值得我们学习(因为有些绘图细节GOplot处理的不是太好,可选择参数有限),而且可以用于其他方向,不局限于GO富集;这个R包也发表了不错的文章

      本文出自于http://www.bioinfo-scrounger.com转载请注明出处

      请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!

      • 分享:
      作者头像
      weinfoeditor

      上一篇文章

      小技巧—怎样将文章图表的基因名放到R中?
      2019年8月21日

      下一篇文章

      Consensus Clustering
      2019年8月21日

      你可能也喜欢

      2-1675088548
      lncRNA和miRNA生信分析系列讲座免费视频课和课件资源包,干货满满
      30 1月, 2023
      9-1675131201
      如何快速批量修改 Git 提交记录中的用户信息
      26 1月, 2023
      8-1678501786
      肿瘤细胞通过改变CD8+ T细胞中的丙酮酸利用和琥珀酸信号来调控抗肿瘤免疫应答。
      7 12月, 2022

      留言 取消回复

      要发表评论,您必须先登录。

      搜索

      分类

      • R语言
      • TCGA数据挖掘
      • 单细胞RNA-seq测序
      • 在线会议直播预告与回放
      • 数据分析那些事儿分类
      • 未分类
      • 生信星球
      • 老俊俊的生信笔记

      投稿培训

      免费

      alphafold2培训

      免费

      群晖配置培训

      免费

      最新博文

      Nature | 单细胞技术揭示衰老细胞与肌肉再生
      301月2023
      lncRNA和miRNA生信分析系列讲座免费视频课和课件资源包,干货满满
      301月2023
      如何快速批量修改 Git 提交记录中的用户信息
      261月2023
      logo-eduma-the-best-lms-wordpress-theme

      (00) 123 456 789

      weinfoadmin@weinformatics.cn

      恒诺新知

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      链接

      • 课程
      • 事件
      • 展示
      • 问答

      支持

      • 文档
      • 论坛
      • 语言包
      • 发行状态

      推荐

      • iHub汉语代码托管
      • iLAB耗材管理
      • WooCommerce
      • 丁香园论坛

      weinformatics 即 恒诺新知。ICP备案号:粤ICP备19129767号

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      要成为一名讲师吗?

      加入数以千计的演讲者获得100%课时费!

      现在开始

      用你的站点账户登录

      忘记密码?

      还不是会员? 现在注册

      注册新帐户

      已经拥有注册账户? 现在登录

      close
      会员购买 你还没有登录,请先登录
      • ¥99 VIP-1个月
      • ¥199 VIP-半年
      • ¥299 VIP-1年
      在线支付 激活码

      立即支付
      支付宝
      微信支付
      请使用 支付宝 或 微信 扫码支付
      登录
      注册|忘记密码?