• 主页
  • 课程

    关于课程

    • 课程归档
    • 成为一名讲师
    • 讲师信息
    教学以及管理操作教程

    教学以及管理操作教程

    ¥1,000.00 ¥100.00
    阅读更多
  • 特色
    • 展示
    • 关于我们
    • 问答
  • 事件
  • 个性化
  • 博客
  • 联系
  • 站点资源
    有任何问题吗?
    (00) 123 456 789
    weinfoadmin@weinformatics.cn
    注册登录
    恒诺新知
    • 主页
    • 课程

      关于课程

      • 课程归档
      • 成为一名讲师
      • 讲师信息
      教学以及管理操作教程

      教学以及管理操作教程

      ¥1,000.00 ¥100.00
      阅读更多
    • 特色
      • 展示
      • 关于我们
      • 问答
    • 事件
    • 个性化
    • 博客
    • 联系
    • 站点资源

      生信星球

      • 首页
      • 博客
      • 生信星球
      • 我完善了那个R包,可以简化多组的差异分析啦

      我完善了那个R包,可以简化多组的差异分析啦

      • 发布者 weinfoeditor
      • 分类 生信星球
      • 日期 2020年6月17日
      测试开头

       今天是生信星球陪你的第652天


         大神一句话,菜鸟跑半年。我不是大神,但我可以缩短你走弯路的半年~

         就像歌儿唱的那样,如果你不知道该往哪儿走,就留在这学点生信好不好~

         这里有豆豆和花花的学习历程,从新手到进阶,生信路上有你有我!

      0.R包安装和准备

      rm(list = ls())
      options(stringsAsFactors = F)
      if(!require(tinyarray))devtools::install_github("xjsun1221/tinyarray")
      if(!require(AnnoProbe))devtools::install_github("jmzeng1314/AnnoProbe")
      library(stringr)
      library(AnnoProbe)
      library(ggplot2)
      library(tinyarray)

      1.数据下载和分组生成

      这里只是举个芯片多分组数据处理栗子,基本上忽略了数据的背景意义,将A组和其他组作比较。

      gse = "GSE32575"

      geo = geo_download(gse)
      geo$exp[1:4,1:4]
      ##               GSM807339  GSM807340  GSM807341  GSM807342
      ## ILMN_1343289 19525.4400 20503.6100 18821.2200 17943.6300
      ## ILMN_1343290 20599.1000 21696.7000 16206.9200 18101.9800
      ## ILMN_1343291 25829.9200 24742.1800 23758.1200 24592.3600
      ## ILMN_1343292   383.6296   353.3019   303.2715   375.0452
      geo$exp=log2(geo$exp+1)
      library(dplyr)
      pd = geo$pd
      identical(rownames(pd),colnames(geo$exp))
      ## [1] TRUE
      group_list = case_when(str_detect(pd$title,"lean_rep")~"A",
                             str_detect(pd$title,"lean_pool")~"B",
                             str_detect(pd$title,"obese_before")~"C",
                             str_detect(pd$title,"obese_after")~"D")

      group_list=factor(group_list,levels = c("A","B","C","D"))

      2.获取探针注释,进行差异分析

      multi_deg_all目前可以完成3、4、5组数据数据的两两差异分析了,返回的dcp里有三个东西:差异分析结果表格,差异基因组成的列表以及可视化

      find_anno(geo$gpl,install = T)
      ## [1] "`ids <- toTable(illuminaHumanv2SYMBOL)` and `ids <- AnnoProbe::idmap('GPL6102')` are both avaliable"
      ids <- toTable(illuminaHumanv2SYMBOL)
      dcp = multi_deg_all(geo$exp,group_list,ids,adjust = F)
      ## 'select()' returned 1:many mapping between keys and columns
      ## 'select()' returned 1:many mapping between keys and columns
      ## 'select()' returned 1:many mapping between keys and columns
      ## [1] "26 DEGs in all,0 DEGs in common."
      names(dcp)
      ## [1] "deg"   "cgs"   "plots"
      cgs = dcp[[2]]
      dcp[[3]]
      我完善了那个R包,可以简化多组的差异分析啦


      忽略有些图的统计学意义太差,我这里只拿他当个例子说一下,数据换了图就好看啦。


      3.简易一点的富集分析

      目前这个简易的富集分析,只支持人类的,其他物种数据库怎么添加我还没研究。。。

      #如果想使用交集就把union_all换成intersect_all
      cg <- union_all(
        cgs[[1]]$diff$diffgenes,
        cgs[[2]]$diff$diffgenes,
        cgs[[3]]$diff$diffgenes
        )
      en = quick_enrich(cg)
      ## Warning in quick_enrich(cg): NAs introduced by coercion
      ## 'select()' returned 1:1 mapping between keys and columns
      ## wrong orderBy parameter; set to default `orderBy = "x"`
      ## wrong orderBy parameter; set to default `orderBy = "x"`
      #enrich会提示引入NA 这个可以忽略。但如果出现了error 可能是因为富集不到任何东西,或者网络有问题。
      en[[3]]
      我完善了那个R包,可以简化多组的差异分析啦
      image.png
      en[[4]]
      我完善了那个R包,可以简化多组的差异分析啦

      这里的en变量里面包括两个富集分析结果和两个点图~再次重申我写这个只是为了提高效率减少一些代码的复制粘贴,有什么建议的话可以发邮件给我~

      插个小广告!

      生信零基础入门学习小组

      全国巡讲全球听(生信线上直播课)

      数据挖掘线上班第3期(两天变三周,实力加量,长期开班)

      一起来学单细胞吗?

      答疑公告:生信星球答疑公告-2020年全年有效

      测试结尾

      请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!

      • 分享:
      作者头像
      weinfoeditor

      上一篇文章

      我写了一个R包,简化芯片的差异分析
      2020年6月17日

      下一篇文章

      转录组差异分析金标准-Limma-voom实战
      2020年6月19日

      你可能也喜欢

      8-1651673488
      生信零基础入门学习小组长期报名中(2022仍继续)
      7 4月, 2022
      2-1651673738
      简化版的ROC曲线
      21 2月, 2022
      8-1651674718
      支持向量机模型
      19 11月, 2021

      搜索

      分类

      • R语言
      • TCGA数据挖掘
      • 单细胞RNA-seq测序
      • 在线会议直播预告与回放
      • 数据分析那些事儿分类
      • 未分类
      • 生信星球
      • 老俊俊的生信笔记

      投稿培训

      免费

      alphafold2培训

      免费

      群晖配置培训

      免费

      最新博文

      Nature | 单细胞技术揭示衰老细胞与肌肉再生
      301月2023
      lncRNA和miRNA生信分析系列讲座免费视频课和课件资源包,干货满满
      301月2023
      如何快速批量修改 Git 提交记录中的用户信息
      261月2023
      logo-eduma-the-best-lms-wordpress-theme

      (00) 123 456 789

      weinfoadmin@weinformatics.cn

      恒诺新知

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      链接

      • 课程
      • 事件
      • 展示
      • 问答

      支持

      • 文档
      • 论坛
      • 语言包
      • 发行状态

      推荐

      • iHub汉语代码托管
      • iLAB耗材管理
      • WooCommerce
      • 丁香园论坛

      weinformatics 即 恒诺新知。ICP备案号:粤ICP备19129767号

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      要成为一名讲师吗?

      加入数以千计的演讲者获得100%课时费!

      现在开始

      用你的站点账户登录

      忘记密码?

      还不是会员? 现在注册

      注册新帐户

      已经拥有注册账户? 现在登录

      close
      会员购买 你还没有登录,请先登录
      • ¥99 VIP-1个月
      • ¥199 VIP-半年
      • ¥299 VIP-1年
      在线支付 激活码

      立即支付
      支付宝
      微信支付
      请使用 支付宝 或 微信 扫码支付
      登录
      注册|忘记密码?