• 主页
  • 课程

    关于课程

    • 课程归档
    • 成为一名讲师
    • 讲师信息
    同等学历教学

    同等学历教学

    免费
    阅读更多
  • 特色
    • 展示
    • 关于我们
    • 问答
  • 事件
  • 个性化
  • 博客
  • 联系
  • 站点资源
    有任何问题吗?
    (00) 123 456 789
    weinfoadmin@weinformatics.cn
    注册登录
    恒诺新知
    • 主页
    • 课程

      关于课程

      • 课程归档
      • 成为一名讲师
      • 讲师信息
      同等学历教学

      同等学历教学

      免费
      阅读更多
    • 特色
      • 展示
      • 关于我们
      • 问答
    • 事件
    • 个性化
    • 博客
    • 联系
    • 站点资源

      未分类

      • 首页
      • 博客
      • 未分类
      • 教程:Gene Set Enrichment Analysis

      教程:Gene Set Enrichment Analysis

      • 发布者 weinfoeditor
      • 分类 未分类
      • 日期 2021年7月20日
      • 评论 0评论

      获取代码请点击:http://weinformatics.com:8084/root/003

      入门级

      本教程的原始帖子可以在我的 GitHub上找到。 有关我用于使此线程可用的引用列表,请参阅页面的最终结束。

      介绍

      假设我们已经进行了RNA-SEQ(或微阵列基因表达)实验,现在想知道哪些途径/生物学过程显示我们的[差异表达]基因的富集。 有些术语可能需要在彻底潜入主题之前熟悉::

      基因集

      基因组是无序的基因集合,其功能相关。

      通路

      通过忽略基因之间的功能关系,可以将途径解释为基因。

      Gene Ontology (GO)

      去描述基因功能。 基因角色/功能可归因于三个主要类:

      • Molecular Function (MF) : 它定义了基因产物的分子活性。

      • Cellular Component (CC) : 这描述了基因产物的活性/局部化。

      • Biological Process (BP) : 描述基因产物活跃的途径和过程。

      Kyoto Encyclopedia of Genes and Genomes (KEGG)

      Kegg是一个集合的代表分子相互作用和反应网络的手动策划路径图。


      有不同的方法广泛用于功能性富集分析:

      1- Over Representation Analysis (ORA): This is the simplest version of enrichment analysis and at the same time the most widely used approach. The concept in this approach is based on a Fisher exact test p-value in a contingency table. There is a relatively large number of web-tools R package for ORA. Personally, I am a fan of DAVID web tools however its last update was in 2016 (DAVID 6.8 Oct. 2016).

      update It is happening to me to have a list of genes and want to know what are common GO terms (usually BP) for these genes regardless of statistical significance. The package clusterProfiler provides a function groupGO that can be used to answer these kinds of questions. I have added codes for this analysis to the GitHub repository.

      2- Gene Set Enrichment Analysis (GSEA):

      It was developed by Broad Institute. This is the preferred method when genes are coming from an expression experiment like microarray and RNA-seq. However, the original methodology was designed to work on microarray but later modification made it suitable for RNA-seq also. In this approach, you need to rank your genes based on a statistic (like what DESeq2 provides, Wald statistic), and then perform enrichment analysis against different pathways (= gene set). You have to download the gene set files into your local system. The point is that here the algorithm will use all genes in the ranked list for enrichment analysis. [in contrast to ORA where only genes passed a specific threshold (like DE ones) would be used for enrichment analysis]. You can find more details about the methodology on the original PNAS paper.. To download these gene sets in a folder go to the MSigDB website, register, and download the data.

      本教程中的步骤:

      (1)差异表达分析,

      (2) 进行GSEA

      以及最后 (3) 可视化。

      参考:

      1- clusterProfiler: universal enrichment tool for functional and comparative study

      2- Fast Gene Set Enrichment Analysis

      3- Gene set enrichment analysis: A knowledge-based approach for interpreting genome-wide expression profiles

      4- DAVID Bioinformatics Resources 6.8

      5- DESeq results in pathways in 60 Seconds with the fgsea package

      6- Rank-rank hypergeometric overlap: identification of statistically significant overlap between gene-expression signatures

      7- Clustering of DAVID gene enrichment results from gene expression studies by Kevin Blighe.

      请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!

      • 分享:
      作者头像
      weinfoeditor

      上一篇文章

      MiBiOmics
      2021年7月20日

      下一篇文章

      Plot.ly Volcano Plot Example
      2021年7月20日

      你可能也喜欢

      2-1675088548
      lncRNA和miRNA生信分析系列讲座免费视频课和课件资源包,干货满满
      30 1月, 2023
      9-1675131201
      如何快速批量修改 Git 提交记录中的用户信息
      26 1月, 2023
      8-1678501786
      肿瘤细胞通过改变CD8+ T细胞中的丙酮酸利用和琥珀酸信号来调控抗肿瘤免疫应答。
      7 12月, 2022

      留言 取消回复

      要发表评论,您必须先登录。

      搜索

      分类

      • R语言
      • TCGA数据挖掘
      • 单细胞RNA-seq测序
      • 在线会议直播预告与回放
      • 数据分析那些事儿分类
      • 未分类
      • 生信星球
      • 老俊俊的生信笔记

      投稿培训

      免费

      alphafold2培训

      免费

      群晖配置培训

      免费

      最新博文

      Nature | 单细胞技术揭示衰老细胞与肌肉再生
      301月2023
      lncRNA和miRNA生信分析系列讲座免费视频课和课件资源包,干货满满
      301月2023
      如何快速批量修改 Git 提交记录中的用户信息
      261月2023
      logo-eduma-the-best-lms-wordpress-theme

      (00) 123 456 789

      weinfoadmin@weinformatics.cn

      恒诺新知

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      链接

      • 课程
      • 事件
      • 展示
      • 问答

      支持

      • 文档
      • 论坛
      • 语言包
      • 发行状态

      推荐

      • iHub汉语代码托管
      • iLAB耗材管理
      • WooCommerce
      • 丁香园论坛

      weinformatics 即 恒诺新知。ICP备案号:粤ICP备19129767号

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      要成为一名讲师吗?

      加入数以千计的演讲者获得100%课时费!

      现在开始

      用你的站点账户登录

      忘记密码?

      还不是会员? 现在注册

      注册新帐户

      已经拥有注册账户? 现在登录

      close
      会员购买 你还没有登录,请先登录
      • ¥99 VIP-1个月
      • ¥199 VIP-半年
      • ¥299 VIP-1年
      在线支付 激活码

      立即支付
      支付宝
      微信支付
      请使用 支付宝 或 微信 扫码支付
      登录
      注册|忘记密码?