豆花等了三天的菜,被别人拿走了…
今天是生信星球陪你的第533天
大神一句话,菜鸟跑半年。我不是大神,但我可以缩短你走弯路的半年~
就像歌儿唱的那样,如果你不知道该往哪儿走,就留在这学点生信好不好~
这里有豆豆和花花的学习历程,从新手到进阶,生信路上有你有我!
豆豆写于2020.2.8
来来来,按我们星球惯例,先来个小故事热热身
豆豆和花花已经没有肉、菜了,仅剩的两个鸡蛋也因为热胀冷缩在蒸蛋器了炸了😂网上买菜等了三天,今天花花下去拿,保安大叔说被早到的一个人拿走了。因为他也是从这里定了菜,所以他一下拿走了两袋而且毫无违和感。不过好在园区的管理非常到位(这里要为大横琴集团点个赞),很快大叔就骑着摩托车帮忙把菜追了回来。
好了不多说了,赶快做顿大餐为这两天瘪瘪的胃道个歉
今天的学习,大概回顾一下基础知识吧
一:ORF与CDS
ORF:open reading frame(开放阅读框)
它是理论上的蛋白编码区,一般是先在DNA序列中寻找起始密码子(AUG)对应的序列ATG,然后按每3个碱基一组向后延伸,一直到出现终止密码子(UAG、UGA、UAA)对应的序列
注意:起始密码子和启动子不是一回事!
CDS:coding sequences (编码区)
它就是与蛋白序列一一对应的DNA序列,并且序列中间不存在其他与蛋白无关的序列,和真实情况最接近
举个例子:
例如这个序列:AACGCATGCAGC
如果用预测的方法得到ORF,它会先找到ATG;然后会以中间的字母T为核心,推测三种可能:
-
第一种:T就是在中心,即ATG,然后按每三个一组,得到:CGC、ATG、CAG
-
第二种:T在左侧,即TGC,同样得到AAC、GCA、TGC、AGC【这就是真实的CDS组合】
-
第三种::T在右侧,即CAT,得到ACG、CAT、GCA
还因为DNA双链,所以总共有3*2=6种不同密码子组合方式
补充
https://www.biostars.org/p/47022/
CDS 与 UTR:
A typical CDS starts with ATG and ends with a stop codon, it doesn’t have any introns, 5′- and 3′-UTR
CDS与ORF:
CDS can be a subset of an open reading frame (ORF).

二:启动子&起始密码子;终止子&终止密码子**
实际上二者之间没有任何关联
-
启动子和终止子都是一段特殊的DNA序列,属于基因的非编码区,分别位于编码区的上游和下游,负责调控基因的转录
-
起始密码子和终止密码子都是mRNA上的三联体碱基序列,分别决定翻译的起始和终止。
启动子 promoter
-
DNA分子上能与RNA聚合酶结合并形成转录起始复合体的区域
-
与RNA聚合酶结合并能起始mRNA合成的序列。做生信分析时,有的选择上游1 kb,下游 500 nt,也有选上下游各1 kb的
强启动子(strong promoter):对RNA聚合酶有很高亲和力的启动子,可以指导合成大量的mRNA
起始密码子 start codon
指定信使RNA(mRNA)上开始合成蛋白质的密码子,也是第一个被核糖体翻译的mRNA上的密码子,位于编码区内,紧邻5′非翻译区。较为常见的起始密码子是AUG
终止子 terminator
-
转录过程中能够终止RNA聚合酶转录的DNA序列
-
终止子可分为两类:一类不依赖于蛋白质辅因子就能实现终止作用。另一类则依赖蛋白辅因子才能实现终止作用
终止密码子 stop codon
终止肽链合成的信使核糖核酸(mRNA)的三联体碱基序列,UAA、UAG和UGA,它们不编码氨基酸
三:转录因子 及结合位点
转录因子(transcription factor)
-
一群能与基因5`端上游特定序列专一性结合,从而保证目的基因以特定的强度在特定的时间与空间表达的蛋白质分子,这些蛋白质能调控其基因的转录。
-
调控方法是转录因子可以调控核糖核酸聚合酶(RNA聚合酶,或叫RNA合成酶)与DNA模板的结合
更详细的转录因子介绍:https://cloud.tencent.com/developer/article/1376739
TF结合位点 transcription factor binding site,TFBS
转录因子调节基因表达时,与基因模板链结合的区域。一般应该分布在基因前端【但:人21和22号染色体上,只有22%的转录因子结合位点分布在蛋白编码基因的5’端】
四:UTR (Untranslated Regions)
非翻译区,是信使RNA(mRNA)分子两端的非编码片段
-
5′-UTR从mRNA起点的甲基化鸟嘌呤核苷酸帽延伸至AUG起始密码子
-
3′-UTR从编码区末端的终止密码子延伸至多聚A尾巴(Poly-A)的前端
最后补充几张图


关于表达调控
BIOL2060: Regulation of Gene Expression

点击底部的“阅读原文”,获得更好的阅读体验哦😻
初学生信,很荣幸带你迈出第一步
🤓生信星球 🌎~ 一个不拽术语、通俗易懂的生信知识平台
请关注“恒诺新知”微信公众号,感谢“R语言“,”数据那些事儿“,”老俊俊的生信笔记“,”冷🈚️思“,“珞珈R”,“生信星球”的支持!