• 主页
  • 课程

    关于课程

    • 课程归档
    • 成为一名讲师
    • 讲师信息
    alphafold2培训

    alphafold2培训

    免费
    阅读更多
  • 特色
    • 展示
    • 关于我们
    • 问答
  • 事件
  • 个性化
  • 博客
  • 联系
  • 站点资源
    有任何问题吗?
    (00) 123 456 789
    weinfoadmin@weinformatics.cn
    注册登录
    恒诺新知
    • 主页
    • 课程

      关于课程

      • 课程归档
      • 成为一名讲师
      • 讲师信息
      alphafold2培训

      alphafold2培训

      免费
      阅读更多
    • 特色
      • 展示
      • 关于我们
      • 问答
    • 事件
    • 个性化
    • 博客
    • 联系
    • 站点资源

      生信星球

      • 首页
      • 博客
      • 生信星球
      • 复习ChIP-Seq的基础知识

      复习ChIP-Seq的基础知识

      • 发布者 weinfoeditor
      • 分类 生信星球
      • 日期 2020年3月10日
      测试开头

       今天是生信星球陪你的第564天


         大神一句话,菜鸟跑半年。我不是大神,但我可以缩短你走弯路的半年~

         就像歌儿唱的那样,如果你不知道该往哪儿走,就留在这学点生信好不好~

         这里有豆豆和花花的学习历程,从新手到进阶,生信路上有你有我!

      豆豆于19.2.3首次接触ChIP-Seq
      中间也没怎么做过相关的项目,不过现在要重拾起来咯,整理一下必备的背景知识(持续补充…)

      背景知识

      • 转录组即某个物种或特定细胞在某一功能状态下产生的所有RNA的总和 (哪些序列能够表达,何时何处表达, 转录活跃程度)

      • 部分基因是能够转录=》染色质多为开放状态;其余基因抑制状态=》染色质状态较为紧密【基因开启、关闭:基因调控】

      • 基因表达调控:信号转导、转录前(染色质构象和表观调控等)、转录调控、转录后调控(剪切、编辑、转运等)、翻译和翻译后调控【针对DNA序列:顺式元件Cis;针对结合因子包括蛋白和非蛋白因子:反式作用因子Trans】

      • 非编码区大量组织特异性调控序列:增强子enhancer、沉默子silencer、绝缘子insulator等+几个/几十/几百调控因子(转录因子、染色质调控蛋白、组蛋白、RNA分子)+三维结构

      • 目前技术:

      • 分离纯化多拷贝的基因组重复序列,如染色体端粒(telomere):locked nucleic acids (LNAs)和transcription activator-like (TAL)

      • 常规技术:ChIP-seq和ChIA-PE依赖于单个调控因子或组蛋白修饰【不能纯化、分析单个调控序列所结合的多个调控因子及三维结构】

      • 挑战:native状态下区分结合调控序列的特异性调控因子和细胞内大量的非特异性因子

      基本原理是:

      特定时间点上用甲醛交联等方式“固定”细胞内所有DNA结合蛋白的活动,细胞内蛋白和DNA相互作用的关系被“截屏”了=》然后裂解细胞、断裂DNA(此时存在蛋白、与蛋白相连的DNA、游离的DNA)=》加上特定抗体取出蛋白及相连的DNA=》将与蛋白相连的DNA解离、纯化=》测序=》看到蛋白质抓取的片段们就是IGV中形成的峰,而游离的DNA们就没有峰

      复习ChIP-Seq的基础知识
      ChIP overview

      发展

      综述:ChIP-seq guidelines and practices of the ENCODE and modENCODE consortia (2012)
      https://www.ncbi.nlm.nih.gov/pubmed/22955991

      染色质免疫沉淀(Chromatin immunoprecipitation ,ChIP)技术诞生很早,由Orlando等人创立于1997年,发表于2000年,先利用Microarray技术 ChIP-chip,后2007年利用DNA sequencing技术 ChIP-seq。虽然技术在进步,但都是要先通过免疫沉淀拉下来DNA。

      它用来研究细胞内DNA与蛋白质相互作用,确定特定蛋白(如转录因子)是否结合特定基因组区域(如启动子或其它DNA结合位点),或确定基因组上与组蛋白修饰相关的特定位点。

      提到两个组织:ENCODE(http://encodeproject.org/ENCODE/ )和modENCODE(http://www.modencode.org/ for small genomes),他们在4个物种(果蝇、秀丽隐杆线虫、人、小鼠)的100多种细胞做了超过1000次ChIP-seq实验,发现了140多种不同的因子和组蛋白修饰
      【与外显子测序不一样,ChIP-seq不是通过设计好的探针来捕获序列,而是通过特异的RNApoly酶、组蛋白、转录因子来捕获,哪里结合蛋白就捕获哪里。每做一次实验,换一个蛋白,所捕获的序列是不一样的】


      豆豆写于19.9.12
      搜集整理一下必备生物知识

      Part1

      来自:http://www.biomart.cn/specials/biosense/article/109930

      真核生物基因的多级调控:

      • 转录水平:DNA甲基化、基因印记、组蛋白共价修饰、染色质重塑、转录启动、ncRNA

      • 转录后水平:转录后加工、非编码RNA、微小RNA、反义RNA、转录产物转运

      • 翻译水平:翻译调控

      • 翻译后水平:翻译后加工

      转录调控要素:

      • 顺式作用元件(cis-acting element)

      • 启动子(promoter)

      • 增强子(enhancer)

      • 沉默子(silencer)

      • 绝缘子(insulator)

      • 反式作用因子(trans-acting factor)

      • 普通转录因子

      • 转录调控因子:DNA-蛋白互作;组织细胞特异性或基因特异性转录因子;类固醇激素、生长因子或其他刺激后开始表达

      • 共调节因子:蛋白-蛋白互作;共激活因子与共抑制因子

      顺式作用元件的表观修饰:

      • DNA甲基化(DNA methylation):在甲基化酶(DNMTs,包括DNMT1、DNMT3a、DNMT3b)催化下,DNA的CG两个核苷酸,一个甲基添加到胞嘧啶的5’-C分子上,形成5-甲基化胞嘧啶

      • DNA羟甲基化(DNA Hydroxymethylation)

      • 组蛋白修饰(histone modification)

      • 染色质重塑(chromatin remodeling)

      Part2 Epigenomics Fact Sheet

      来自:https://www.genome.gov/about-genomics/fact-sheets/Epigenomics-Fact-Sheet

      什么是表观组?

      • The epigenome is a multitude of chemical compounds that can tell the genome what to do.

      • 基因组中的DNA遵循一定的规律,去构建一个细胞中具有不同功能的蛋白

      • 表观组的化学成分、蛋白复合物可以加到DNA上,指导基因激活还是关闭,控制细胞中蛋白合成,这个过程称为“mark”,也就是修饰

      • 这些用来修饰的成分并不改变基因组的序列组成,只是改变了游戏规则

      • 这些修饰成分有时可以在细胞间传递(例如细胞分裂时),另外还可以从上一代传给下一代

      表观组做了什么?

      人体中包含了超过万亿的细胞,在不同组织中担任不同功能,但是它们细胞核的基因组都是相同的,不同的就是其中不同的基因打开关闭状态。例如眼睛的细胞将检测光的基因特异性激活,而血红细胞会将与氧气运输相关的基因激活。

      复习ChIP-Seq的基础知识

      豆豆写于2020.3.10
      看到这篇写的不错:https://abego.cn/2019/08/10/first-series-the-protocol-of-chip-seq/#section-01

      实验角度

      染色质免疫沉淀测序技术(ChIP-Seq),用于寻找转录因子结合的DNA区域,以及寻找发生组蛋白修饰的基因组位置。

      实验上可以分成:Cross-linked ChIP (XChIP)、Native ChIP (NChIP)
      它们之间的比较:
      https://en.wikipedia.org/wiki/Chromatin_immunoprecipitation#Comparison_of_XChIP_and_NChIP

      • N-ChIP不不涉及甲醛交联,更适合那些和DNA有强相互作用的蛋白ChIP-Seq实验,如组蛋白

      • X-ChIP采用甲醛交联,广泛适用于转录因子, 组蛋白, 聚合酶等蛋白的结合片段测序【大部分都是X-ChIP】

      一般的实验步骤

      1. 首先用化学试剂(通常是甲醛)处理细胞或组织,以使蛋白质与DNA共价交联

      2. 然后进行细胞破碎和超声处理、消化完后, 利用核酸酶将染色质剪切成100-300bp的目标片段

      3. 再利用目标因子特异性抗体纯化

      复习ChIP-Seq的基础知识

      以上方法适用于能与染色质结合的蛋白质(转录因子,修饰的组蛋白,RNA聚合酶等

      但还存在一些特殊情况:蛋白并没有特异抗体, 或者制备抗体的难度很高。那么就可以通过融合表达标签, 产生具有标签的标记因子,并通过对标签特异的抗体来进行富集

      融合标签参考:http://www.biodiscover.com/news/research/730610.html
      融合标签技术是20世纪末兴起的一种基因重组技术,利用重组DNA技术在靶蛋白编码基因的3’端或5’端融合某种标签的编码基因,通过适宜的宿主来表达重组蛋白质。
      融合标签根据其分子量大小可分为两大类:大的蛋白质分子(或蛋白质结构域及其衍生物)和小的多肽片段

      注意

      • 实验的好坏主要取决于抗体的特异性和对目标分子的亲和能力

      • 一般产生的问题有:对靶标的亲和能力不足;非特异性结合

      • 需要对抗体识别抗原的效率和准确性进行验证:qPCR验证和跑蛋白胶,理论上讲只有IP样本才会有免疫荧光

      • 组蛋白修饰的抗体, 对IP的精度要求更高:因为少量修饰组蛋白和大量的未修饰组蛋白的差异就在少数几个位点上,同时抗体还需要很好的区分出来修饰的位点,比如H3K9me1,H3K9me2和H3K9me3

      • 问题又来了,如果加了标签,那么是否会影响目标蛋白的活性和富集区域?可以加一个mock-ip的对照(也就是标签蛋白或者IgG的IP样本)

      ENCODE的ChIP-Seq指南

      https://genome.cshlp.org/content/22/9/1813.full
      对超过140种转录因子进行了超过一千次独立的ChIP-seq实验,并对多种动植物的100多种细胞类型进行了组蛋白修饰研究
      其中包括:抗体验证,生物学重复,测序深度,数据质量评估

      关于生物学重复

      ENCODE根据细胞系,胚胎和组织样的实验情况。进行了生物学重复的数量的评估. 结果显示:超过两个生物学重复的ChIP-seq实验没有显着改善位点发现。一般两个重复即可

      关于数据量

      推荐是哺乳动物每个生物重复至少使用10M unique比对的片段;如果是worms and flies :2M unique reads

      复习ChIP-Seq的基础知识
      反推数据量

      如果去掉PCR重复和没有比对成功的reads(就按最后能得到75%的unique reads来算),并且使用PE 150测序,那么数据量就是:300bp * 10M / 0.75

      更快地计算数据量

      测序报告会给出reads数,如果测序策略是PE150,那么占用硬盘空间大小就是n(reads)*(150+150+45)/1024^3,然后测序仪下机后的数据都是用gz压缩后的文件.fastq.gz,能压缩约2.7倍

      关于对照

      必要性:

      • 超声处理期间DNA断裂不均匀,尤其是开放染色质的一些区域会优先的被超声断裂

      • 测序平台的PCR扩增和检测的偏差导致的不均匀性

      input对照

      对照和处理在相同的条件下,进行交联和片段化,并提取DNA,这部分的DNA是没经过IP的DNA,其余全一样

      Mock-ip对照

      使用与目标蛋白无关的非目标抗体(IgG或者标签)进行“模拟”的IP,为了防止抗体的非特异性结合

      注意
      • ENCODE要求对照组的测序深度至少要等于或者要大于IP样品的测序深度

      • 实际上,很多标签或抗体非特异结合位点是已知的,而且mock IP样本制作复杂,因此使用input样本的比较多

      • 要使用相同的方案来构建IP和对照测序文库, 也就是意味着PCR扩增循环数,片段大小, 测序文库都应该尽量一致


      点击底部的“阅读原文”,获得更好的阅读体验哦😻

      初学生信,很荣幸带你迈出第一步

      🤓生信星球 🌎~ 一个不拽术语、通俗易懂的生信知识平台

      测试结尾

      请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!

      • 分享:
      作者头像
      weinfoeditor

      上一篇文章

      WES上游三款软件结果的探索
      2020年3月10日

      下一篇文章

      生信分析工具-收录(不定时去除熟悉的软件)
      2020年3月10日

      你可能也喜欢

      8-1651673488
      生信零基础入门学习小组长期报名中(2022仍继续)
      7 4月, 2022
      2-1651673738
      简化版的ROC曲线
      21 2月, 2022
      8-1651674718
      支持向量机模型
      19 11月, 2021

      搜索

      分类

      • R语言
      • TCGA数据挖掘
      • 单细胞RNA-seq测序
      • 在线会议直播预告与回放
      • 数据分析那些事儿分类
      • 未分类
      • 生信星球
      • 老俊俊的生信笔记

      投稿培训

      免费

      alphafold2培训

      免费

      群晖配置培训

      免费

      最新博文

      白介素-17受体信号的自主激活,维持炎症并促进疾病进展
      048月2023
      MCT4依赖的乳酸分泌抑制LKB1缺陷肺腺癌的抗肿瘤免疫
      187月2023
      Nature | 单细胞技术揭示衰老细胞与肌肉再生
      301月2023
      logo-eduma-the-best-lms-wordpress-theme

      (00) 123 456 789

      weinfoadmin@weinformatics.cn

      恒诺新知

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      链接

      • 课程
      • 事件
      • 展示
      • 问答

      支持

      • 文档
      • 论坛
      • 语言包
      • 发行状态

      推荐

      • iHub汉语代码托管
      • iLAB耗材管理
      • WooCommerce
      • 丁香园论坛

      weinformatics 即 恒诺新知。ICP备案号:粤ICP备19129767号

      • 关于我们
      • 博客
      • 联系
      • 成为一名讲师

      要成为一名讲师吗?

      加入数以千计的演讲者获得100%课时费!

      现在开始

      用你的站点账户登录

      忘记密码?

      还不是会员? 现在注册

      注册新帐户

      已经拥有注册账户? 现在登录

      close
      会员购买 你还没有登录,请先登录
      • ¥99 VIP-1个月
      • ¥199 VIP-半年
      • ¥299 VIP-1年
      在线支付 激活码

      立即支付
      支付宝
      微信支付
      请使用 支付宝 或 微信 扫码支付
      登录
      注册|忘记密码?