• 主页
  • 课程

    关于课程

    • 课程归档
    • 成为一名讲师
    • 讲师信息
    同等学历教学

    同等学历教学

    免费
    阅读更多
  • 特色
    • 展示
    • 关于我们
    • 问答
  • 事件
  • 个性化
  • 博客
  • 联系
  • 站点资源
    有任何问题吗?
    (00) 123 456 789
    weinfoadmin@weinformatics.cn
    注册登录
    恒诺新知
    • 主页
    • 课程

      关于课程

      • 课程归档
      • 成为一名讲师
      • 讲师信息
      同等学历教学

      同等学历教学

      免费
      阅读更多
    • 特色
      • 展示
      • 关于我们
      • 问答
    • 事件
    • 个性化
    • 博客
    • 联系
    • 站点资源

      未分类

      • 首页
      • 博客
      • 未分类
      • GEO数据库中国区镜像横空出世

      GEO数据库中国区镜像横空出世

      • 发布者 weinfoeditor
      • 分类 未分类
      • 日期 2019年12月13日
      • 评论 0评论

      接收到太多的粉丝求助,想下载个表达矩阵做一下数据挖掘偏偏第一步就卡在了,数据文件下载半天毫无动静,或者下载到99%就卡死了。如果我恰好在电脑旁,通常会帮忙下载后微云或者百度云传递给粉丝,但这毕竟不是长久之计。

      经过个把月的不懈努力,我终于把全部的GEO数据库里面的表达芯片数据都下载并且全部格式化处理成为r数据文件,并且购置一个2万块钱的腾讯云服务器来存放它们,供广大粉丝使用!

      下载使用GEOmirror

      Or just use source function to load the codes of geoChina function, as below:

      source('http://raw.githubusercontent.com/jmzeng1314/GEOmirror/master/R/geoChina.R') 
      

      What if all these 3 methods failed? I'm so sorry, what' a pity that there's no chance for you to use our GEOmirror !!

      安装成功后,加载我们的R包会有一个提示,妈妈以后再也不用担心自己不知道怎么样致谢生信技能树团队啦!

      image-20191130112132080image-20191130112132080

      这个就是官方致谢:在感恩节官宣!(文末有惊喜哈)

      使用起来非常方便,就一句话,找到你的GSE数据集的ID,传给我们的函数即可:

      use it to download GEO dataset, as below :

      eSet=geoChina('GSE1009') 
      eSet=geoChina('GSE27533') 
      eSet=geoChina('GSE95166') 
      

      举一个简单的例子

      Once you download the ExpressionSet of GEO dataset, you can access the expression matrix and phenotype data:

      ## download GSE95166 data
      # https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE95166
      #eSet=getGEO('GSE95166', destdir=".", AnnotGPL = F, getGPL = F)[[1]]
      library(GEOmirror)
      eSet=geoChina('GSE95166')
      eSet
      eSet=eSet[[1]]
      
      
      probes_expr <- exprs(eSet);dim(probes_expr)
      head(probes_expr[,1:4])
      boxplot(probes_expr,las=2)
      
      ## pheno info
      phenoDat <- pData(eSet)
      head(phenoDat[,1:4])
      # https://www.ncbi.nlm.nih.gov/pubmed/31430288
      
      groupList=factor(c(rep('npc',4),rep('normal',4)))
      table(groupList)
      eSet@annotation
      # GPL15314    Arraystar Human LncRNA microarray V2.0 (Agilent_033010 Probe Name version)
      

      对于这一点表达矩阵数据集,我们可以看看PCA图,火山图以及热图:

      image-20191130112636685image-20191130112636685

      代码如下:

      genes_expr=probes_expr
      library("FactoMineR")
      library("factoextra")
      dat.pca <- PCA(t(genes_expr) , graph = FALSE)
      dat.pca
      fviz_pca_ind(dat.pca,
                   geom.ind = "point",
                   col.ind = groupList,
                   addEllipses = TRUE,
                   legend.title = "Groups"
      )
      library(limma)
      design=model.matrix(~factor(groupList))
      design
      fit=lmFit(genes_expr,design)
      fit=eBayes(fit)
      DEG=topTable(fit,coef=2,n=Inf)
      head(DEG)
      # We observed that 2107 lncRNAs were upregulated
      # while 2090 lncRNAs were downregulated by more than 2-fold,
      # NKILA among these downregulated lncRNAs (Fig 1A, GSE95166).
      
      ## for volcano plot
      df=DEG
      attach(df)
      df$v= -log10(P.Value)
      df$g=ifelse(df$P.Value>0.05,'stable',
                  ifelse( df$logFC >1,'up',
                          ifelse( df$logFC < -1,'down','stable') )
      )
      table(df$g)
      df$name=rownames(df)
      head(df)
      library(ggpubr)
      ggpubr::ggscatter(df, x = "logFC", y = "v", color = "g",size = 0.5,
                label = "name", repel = T,
                label.select =head(rownames(df)),
                palette = c("#00AFBB", "#E7B800", "#FC4E07") )
      detach(df)
      
      
      x=DEG$logFC
      names(x)=rownames(DEG)
      cg=c(names(head(sort(x),100)),
           names(tail(sort(x),100)))
      cg
      library(pheatmap)
      n=t(scale(t(genes_expr[cg,])))
      n[n>2]=2
      n[n< -2]= -2
      n[1:4,1:4]
      ac=data.frame(groupList=groupList)
      rownames(ac)=colnames(n)  
      pheatmap(n,show_colnames =F,show_rownames = F,
               annotation_col=ac)
      

      实际上,这个时候,我们需要把探针的ID转换为基因名字,进行后续分析,不过这个比较复杂超出了本文范围,感兴趣的看:(重磅!价值一千元的R代码送给你)芯片探针序列的基因组注释

      是不是很激动,想试试看

      同样的代码,你可以处理自己的数据集哦。

      因为功能非常简单,just a replacement of getGEO function from GEOquery package.

      所以是不会有bug的,但是,也许大家在使用的过程有新的需求,我可以酌情根据时间来开发增加功能

      请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!

      • 分享:
      作者头像
      weinfoeditor

      上一篇文章

      RNAseq数据,下载GEO中的FPKM文件后该怎么下游分析
      2019年12月13日

      下一篇文章

      TCGA之获取指定癌症的感兴趣基因的表达量
      2019年12月13日

      你可能也喜欢

      2-1675088548
      lncRNA和miRNA生信分析系列讲座免费视频课和课件资源包,干货满满
      30 1月, 2023
      9-1675131201
      如何快速批量修改 Git 提交记录中的用户信息
      26 1月, 2023
      8-1678501786
      肿瘤细胞通过改变CD8+ T细胞中的丙酮酸利用和琥珀酸信号来调控抗肿瘤免疫应答。
      7 12月, 2022

      留言 取消回复

      要发表评论,您必须先登录。

      搜索

      分类

      • R语言
      • TCGA数据挖掘
      • 单细胞RNA-seq测序
      • 在线会议直播预告与回放
      • 数据分析那些事儿分类
      • 未分类
      • 生信星球
      • 老俊俊的生信笔记

      投稿培训

      免费

      alphafold2培训

      免费

      群晖配置培训

      免费

      最新博文

      Nature | 单细胞技术揭示衰老细胞与肌肉再生
      301月2023
      lncRNA和miRNA生信分析系列讲座免费视频课和课件资源包,干货满满
      301月2023
      如何快速批量修改 Git 提交记录中的用户信息
      261月2023
      logo-eduma-the-best-lms-wordpress-theme

      (00) 123 456 789

      weinfoadmin@weinformatics.cn

      恒诺新知

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      链接

      • 课程
      • 事件
      • 展示
      • 问答

      支持

      • 文档
      • 论坛
      • 语言包
      • 发行状态

      推荐

      • iHub汉语代码托管
      • iLAB耗材管理
      • WooCommerce
      • 丁香园论坛

      weinformatics 即 恒诺新知。ICP备案号:粤ICP备19129767号

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      要成为一名讲师吗?

      加入数以千计的演讲者获得100%课时费!

      现在开始

      用你的站点账户登录

      忘记密码?

      还不是会员? 现在注册

      注册新帐户

      已经拥有注册账户? 现在登录

      close
      会员购买 你还没有登录,请先登录
      • ¥99 VIP-1个月
      • ¥199 VIP-半年
      • ¥299 VIP-1年
      在线支付 激活码

      立即支付
      支付宝
      微信支付
      请使用 支付宝 或 微信 扫码支付
      登录
      注册|忘记密码?