• 主页
  • 课程

    关于课程

    • 课程归档
    • 成为一名讲师
    • 讲师信息
    alphafold2培训

    alphafold2培训

    免费
    阅读更多
  • 特色
    • 展示
    • 关于我们
    • 问答
  • 事件
  • 个性化
  • 博客
  • 联系
  • 站点资源
    有任何问题吗?
    (00) 123 456 789
    weinfoadmin@weinformatics.cn
    注册登录
    恒诺新知
    • 主页
    • 课程

      关于课程

      • 课程归档
      • 成为一名讲师
      • 讲师信息
      alphafold2培训

      alphafold2培训

      免费
      阅读更多
    • 特色
      • 展示
      • 关于我们
      • 问答
    • 事件
    • 个性化
    • 博客
    • 联系
    • 站点资源

      生信星球

      • 首页
      • 博客
      • 生信星球
      • ChIP-seq的实验对照与偏差来源

      ChIP-seq的实验对照与偏差来源

      • 发布者 weinfoeditor
      • 分类 生信星球
      • 日期 2020年3月31日
      测试开头

       今天是生信星球陪你的第582天


         大神一句话,菜鸟跑半年。我不是大神,但我可以缩短你走弯路的半年~

         就像歌儿唱的那样,如果你不知道该往哪儿走,就留在这学点生信好不好~

         这里有豆豆和花花的学习历程,从新手到进阶,生信路上有你有我!

      豆豆写于2020.3.31
      之前介绍了:
      (一)了解ChIP-seq的实验流程
      (二)继续了解ChIP-seq
      这次来看看实验设计中的对照设置与偏差来源

      1 ChIP-seq的对照

      阳性对照

      一般阳性对照不进行测序;用anti-RNA polymerase II抗体,因为RNA polymerase II是通用转录因子,在所有细胞中都能结合基因的核心启动子区,因此理论上,ChIP后PCR会有条带

      阴性对照

      一般有三种:

      • input DNA:【少了加抗体的步骤】在交联和超声裂解后,并没有加入抗体,跳过了免疫沉淀过程,直接将这些DNA进行测序

      设置input是必要的:因为超声破碎过程中DNA的断裂不均一,尤其是一些开放染色质区域;未经过IP的样本超声破碎后会产生数量不小的peaks

      input DNA是最常用的:可以有去除背景噪音的作用(排除因本身表达水平高或一些非特异性结合所造成的假阳性peaks);
      另外IP与input比较可以验证染色质断裂效果,判断ChIP效率(如果用同一引物进行PCR,ChIP组和input组亮度差不多,说明ChIP效率高,样本中所有的目的基因片段都被ChIP下来了)

      图片来自:
      https://yourgene.pixnet.net/blog/post/92801087-chip-seq%E5%B8%B8%E8%A6%8B%E7%9A%84%E5%95%8F%E9%A1%8C

      ChIP-seq的实验对照与偏差来源
      • mock IP DNA:【步骤一样但没有抗体】和常规的ChIP-seq流程一样,但并没有使用特异性抗体

      • Nonspecific IP DNA:【步骤一样但换了抗体】和常规的ChIP-seq流程一样,但它是用普通IgG为抗体。这个IgG有个特点:不能结合染色质上任何蛋白质,理论上不会ChIP下来任何DNA片段

      不过由于非特异结合,或者实验过程中,没有发生结合的DNA清除不完全,可能也会出现条带,导致后期建库过程中PCR循环数增加,不能达到作为对照去除背景噪音的目的

      另外,在研究组蛋白修饰时,使用pan-H3或pan-H4抗体作为对照可能是个不错的选择。它们能识别H3或H4但又不会考虑修饰位点。总而言之,不管修不修饰它都会捕获到。

      2 实验偏差(bias)的来源

      来源一:染色质裂解不均一

      正如上面所说,设置input的一个重要原因就是:超声破碎过程中DNA的断裂不均一,尤其是一些开放染色质区域,这也是最重要的bias来源。

      越开放的地方(如开放染色质区域),越容易断裂成适当长度,从而被抓取出来,后期出现的频率就越高,越容易形成假的peaks;而一些本来就紧凑不易伸展的区域,当然也不好断裂,于是后面出现的机会就更少

      另外,裂解不均一和PCR扩增偏差主要发生在GC富集区域,基因组上的reads分布与基因组区域GC含量成正比。这个现象在哺乳动物细胞中尤为常见,常染色质区域由于存在CpG岛而经常富集reads,因此在比较CpG岛和其他区域时也要注意这个bias

      CpG岛:主要位于基因的启动子和外显子区域,是富含CpG二核苷酸的一些区域,长度为300—3000bp。在哺乳动物中CpG位点以两种形式存在:一种是分散于DNA序列中;另一种呈现高度聚集状态,称之为CpG岛(CpG island);正常组织里,70%~90%散在的CpG是被甲基修饰的,而与之相反,大小为100-1000bp左右且富含CpG二核苷酸的CpG岛,则往往非甲基化的

      GC bias与PCR:二代数据体现出的测序深度与GC 含量的相关性就是GC bias。

      • 来自deeptools的解释(https://deeptools.readthedocs.io/en/develop/content/tools/computeGCBias.html)In reality, the DNA polymerases used for PCR-based amplifications during the library preparation of the sequencing protocols prefer GC-rich regions. This will influence the outcome of the sequencing as there will be more reads for GC-rich regions just because of the DNA polymerase’s preference.

      • 来自文章:DNA polymerase preference determines PCR priming efficiency(https://www.ncbi.nlm.nih.gov/pubmed/24479830)PCR is known to introduce biases, especially during multiplex reactions. DNA polymerase as the primary source of bias, particularly initiation of polymerization on the template strand. Preferentially amplified sequence motifs at the 3’ end of the primer were identified. These motifs demonstrated a marked GC-rich bias pattern.

      统计GC含量与测序深度:

      • http://www.bio-info-trainee.com/2309.html,趋势就是:GC含量比较高的窗口,有着相应比较高的测序深度!

      • http://blog.sciencenet.cn/blog-3406804-1165467.html,提供了脚本

      来源二:数据计算

      在比对阶段,只有unique比对的reads才被保留下来,这样会使得重复序列区域的覆盖度很低。另外,癌症样本的基因组和参考基因组序列不同,有的样本中某些基因组序列会缺失,拉低整体,间接导致另一些重复扩增的序列看似“富集”。

      因此,在数据处理阶段,设置一个ChIP样本的对照是很有必要的,可以控制假阳性peaks;如果没有对照(例如ChIP-exo),也可以比较不同实验设计的样本


      点击底部的“阅读原文”,获得更好的阅读体验哦😻

      初学生信,很荣幸带你迈出第一步

      🤓生信星球 🌎~ 一个不拽术语、通俗易懂的生信知识平台

      测试结尾

      请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!

      • 分享:
      作者头像
      weinfoeditor

      上一篇文章

      Jupyter数据科学分析环境-R python Julia
      2020年3月31日

      下一篇文章

      哈佛喊你在家学生信,并向你扔了一份清单
      2020年4月1日

      你可能也喜欢

      8-1651673488
      生信零基础入门学习小组长期报名中(2022仍继续)
      7 4月, 2022
      2-1651673738
      简化版的ROC曲线
      21 2月, 2022
      8-1651674718
      支持向量机模型
      19 11月, 2021

      搜索

      分类

      • R语言
      • TCGA数据挖掘
      • 单细胞RNA-seq测序
      • 在线会议直播预告与回放
      • 数据分析那些事儿分类
      • 未分类
      • 生信星球
      • 老俊俊的生信笔记

      投稿培训

      免费

      alphafold2培训

      免费

      群晖配置培训

      免费

      最新博文

      白介素-17受体信号的自主激活,维持炎症并促进疾病进展
      048月2023
      MCT4依赖的乳酸分泌抑制LKB1缺陷肺腺癌的抗肿瘤免疫
      187月2023
      Nature | 单细胞技术揭示衰老细胞与肌肉再生
      301月2023
      logo-eduma-the-best-lms-wordpress-theme

      (00) 123 456 789

      weinfoadmin@weinformatics.cn

      恒诺新知

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      链接

      • 课程
      • 事件
      • 展示
      • 问答

      支持

      • 文档
      • 论坛
      • 语言包
      • 发行状态

      推荐

      • iHub汉语代码托管
      • iLAB耗材管理
      • WooCommerce
      • 丁香园论坛

      weinformatics 即 恒诺新知。ICP备案号:粤ICP备19129767号

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      要成为一名讲师吗?

      加入数以千计的演讲者获得100%课时费!

      现在开始

      用你的站点账户登录

      忘记密码?

      还不是会员? 现在注册

      注册新帐户

      已经拥有注册账户? 现在登录

      close
      会员购买 你还没有登录,请先登录
      • ¥99 VIP-1个月
      • ¥199 VIP-半年
      • ¥299 VIP-1年
      在线支付 激活码

      立即支付
      支付宝
      微信支付
      请使用 支付宝 或 微信 扫码支付
      登录
      注册|忘记密码?