真核生物基因组结构.pptx

上传人:莉*** 文档编号:88438484 上传时间:2023-04-26 格式:PPTX 页数:67 大小:836.74KB
返回 下载 相关 举报
真核生物基因组结构.pptx_第1页
第1页 / 共67页
真核生物基因组结构.pptx_第2页
第2页 / 共67页
点击查看更多>>
资源描述

《真核生物基因组结构.pptx》由会员分享,可在线阅读,更多相关《真核生物基因组结构.pptx(67页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、C C值(值(C-valueC-value):一个物种单倍体基因组的:一个物种单倍体基因组的DNADNA含量,含量,通常称为该物种的通常称为该物种的C C值。值。每个物种的每个物种的C C值是相对恒定的,不同物种的值是相对恒定的,不同物种的C C值差值差异极大。异极大。一般一般随着生物结构和功能复杂程度的增加而随着生物结构和功能复杂程度的增加而C C值增值增大大,即:生物细胞中的,即:生物细胞中的C C值具有从低等生物到高等生物值具有从低等生物到高等生物逐渐增加的趋势。逐渐增加的趋势。一、真核生物基因组的大小一、真核生物基因组的大小第1页/共67页支原体细菌酵母霉菌蠕虫昆虫鸟类两栖类哺 乳类1

2、010109108107106第2页/共67页 低等动物的低等动物的C C值大于高等动物值大于高等动物 如:两栖类的如:两栖类的C C值大于哺乳类值大于哺乳类 肺鱼的肺鱼的C C值比哺乳动物大值比哺乳动物大10101515倍倍 同一门中的动物同一门中的动物C C值变化很大值变化很大如:两栖类中的如:两栖类中的C C值变化很大,可相差值变化很大,可相差100100倍倍家蝇的比果蝇的大家蝇的比果蝇的大6 6倍倍指指 C C值与生物进化复杂性之间不相对应的现象值与生物进化复杂性之间不相对应的现象,也,也叫叫 C C值反常理论值反常理论。说明真核生物基因组中许多的说明真核生物基因组中许多的DNADNA

3、序列不编码蛋白质。序列不编码蛋白质。表现:表现:C值悖理理论(C-value paradox)第3页/共67页植物鸟类哺乳动物爬行动物两栖动物硬骨鱼软骨鱼棘皮动物甲壳动物昆虫软体动物蠕虫霉菌藻类真菌格兰氏阳性菌格兰氏阴性菌支原体阴影部分为一个门内C-值的范围第4页/共67页二、真核生物基因组的基因数量二、真核生物基因组的基因数量 不同物种编码基因差别很大,从不同物种编码基因差别很大,从500500个到个到5000050000个,个,有有100100倍的差距。倍的差距。真核生物的基因数量通常在真核生物的基因数量通常在60006000到到5000050000之间。之间。人的人的基因组的全长为大约基

4、因组的全长为大约3 X 103 X 109 9对对碱基,编码碱基,编码 3-43-4万个基因万个基因;但某些寄生的真核生物,如脑微孢子虫,基因数量但某些寄生的真核生物,如脑微孢子虫,基因数量可能不超过可能不超过30003000个,比很多细菌的基因数量还少。个,比很多细菌的基因数量还少。第5页/共67页其中,其中,C C是单链是单链DNADNA在在t t时刻的浓度。时刻的浓度。k k复性速度常数复性速度常数三、真核生物基因组的非重复序列和重复序列三、真核生物基因组的非重复序列和重复序列1.DNA复性动力学复性动力学DNADNA的复性过程遵循二级反应动力学。的复性过程遵循二级反应动力学。的复性过程

5、遵循二级反应动力学。的复性过程遵循二级反应动力学。DNADNA复性过程中复性的速度用公式表示:复性过程中复性的速度用公式表示:dC/dt=-dC/dt=-k kC C0 02 2第6页/共67页 对上式积分后重排,对上式积分后重排,对上式积分后重排,对上式积分后重排,得出得出得出得出复性动力学方程复性动力学方程复性动力学方程复性动力学方程:C CC C0 01 1(1 1 k k C C0 0t t)C C0 0为单链为单链DNADNA的起始浓度,的起始浓度,C C为单链为单链DNADNA在在t t时刻的浓度,时刻的浓度,单位单位mol/Lmol/L。t t为复性时间为复性时间,单位为单位为s

6、 s(秒)。重组速率常数(秒)。重组速率常数k k的的单位为单位为L/molL/mol,取决于阳离子的浓度、温度、片段大小和,取决于阳离子的浓度、温度、片段大小和DNADNA序列的复杂性。序列的复杂性。当 C/C0=1/2 时的C0t值定义为C0t1/2C /C0=1/2=1/(1+k C0t(1/2)Cot(1/2)=1/k(mol.Sec/L)即复性反应完成一半时第7页/共67页p在在控控制制反反应应条条件件(初初始始浓浓度度、温温度度、离离子子强强度度、片片段段大大小小)相相同同的的前前提提下下,DNA分分子子的的C0t(1/2)值值,取取决决于于核核苷苷酸的排列复杂性。酸的排列复杂性。

7、pDNA序序列列的的复复杂杂度度(complexity)X:最最长长的的没没有有重重复复序序列列的核苷酸对的数值。的核苷酸对的数值。AAAAAAAA X=1ATCGATCGATCG X=4 N=105 X=105DNA序列的复杂性、初始浓度、片段大小、温度、离子强度DNA复性的影响因素:复性的影响因素:X=k Cot1/2第8页/共67页n相同核苷酸数量的DNA,复杂性小的DNA分子复性快,Cot(1/2)值小;复杂性大的DNA分子复性慢,Cot(1/2)大。nCot曲线:表示复性速度与DNA顺序复杂性的关系。Cot(1/2)=1/k(mol.Sec/L)第9页/共67页 Cot曲线第10页/

8、共67页2.利用复性动力学鉴定基因组序列第11页/共67页原核生物Cot曲线的特点:形状相似(跨越2-3个数量级),Cot(12)不相同单一序列,只是复杂性不同。第12页/共67页复杂性复杂性X 1不同原核生物的Cot曲线复性分数(1-c/c0)Cot第13页/共67页P74图16真核生物DNA复性曲线的模式图复性反应分为三相,每相代表不同复杂长度的序列类型第14页/共67页 根据复性动力学特征的不同,将真核生物DNA序列分为4类:p 零时复性序列p 快速复性序列p 中速复性序列p 慢速复性序列第15页/共67页1)零时复性序列:具有反向重复结构(也称回文结构),可在同一条链内形成双链区,变性

9、后再复性时,在链间复性之前就已发生链内复性,因此不遵循二级反应动力学方程。由于这种序列的复性速度非常快,在动力学上称为零时(或瞬时)复性序列。DNA复性后可出现发卡形结构。这种序列常常是DNA复制酶、转录酶以及特异蛋白质的结合部位。第16页/共67页2 2)快速复性序列:也叫高度重复序列(Highly repetitive sequence)大部分集中于异染色质区,特别是在着丝粒和端粒区,往往没有转录功能。占基因组的10-60%,长度6 200bp,重复次数在105以上。第17页/共67页P74图16真核生物DNA复性曲线的模式图复性反应分为三相,每相代表不同复杂长度的序列类型第18页/共67

10、页3)中速复性序列:基因组中重复次数105的重复顺序,重复单位平均长度约300bp;复性速度快于单拷贝顺序,慢于高度重复顺序。多与单拷贝基因间隔排列。多为非编码序列,如Alu序列也有编码基因产物的,如rDNA、tDNA、组蛋白基因家族,一般往往以基因家族的形式存在。也叫中度重复序列(moderate repetitive sequences)第19页/共67页Alu family(Alu 家族):长约300bp的片段,大多数片段含有一个限制性内切酶Alu的酶切位点(AGCT);均匀分散在整个基因组中的非重复序列间;在人类基因组中占1 3;第20页/共67页4)慢速复性序列:C0t1/2一般在1

11、03mol.s/L以上,复性速度极慢,在一个基因组中只有一个拷贝或23个拷贝,也称非重复序列(单一序列、单拷贝序列)。l结构基因(蛋白质基因)大多是单拷贝序列。第21页/共67页P74图16真核生物DNA复性曲线的模式图复性反应分为三相,每相代表不同复杂长度的序列类型第22页/共67页大部分结构基因位于非重复的DNA序列内第23页/共67页第二节第二节 断裂基因(断裂基因(split gene)不连续基因(不连续基因(interrupted gene)编码某一编码某一RNARNA的基因中有些序列并不出现在成熟的基因中有些序列并不出现在成熟的的RNARNA序列中,成熟序列中,成熟RNARNA的序

12、列在基因中被其他的的序列在基因中被其他的序列隔开。序列隔开。一、断裂基因由外显子和内含子组成一、断裂基因由外显子和内含子组成1 1、断裂基因的发现、断裂基因的发现 通过成熟通过成熟mRNAmRNA(或(或cDNAcDNA)与编码基因的)与编码基因的DNADNA杂杂交试验而发现。交试验而发现。第24页/共67页鸡卵清蛋白成熟mRNA与DNA杂交电镜图DNAmRNA第25页/共67页断裂基因由外显子和内含子组成。1978 Gilbert 首创这两个概念 二、外显子(外元、Exon)DNA 与成熟RNA间的对应区域氨基酸的编码区(amino acid coding region)非间隔区(unspa

13、cer)原初转录物中通过原初转录物中通过RNARNA拼接反应而保留于拼接反应而保留于成熟成熟RNARNA中的序列中的序列或基因中与成熟或基因中与成熟RNARNA序列相对应的序列相对应的DNADNA序列序列。2.断裂基因的结构断裂基因的结构第26页/共67页1.外显子具有保守的序列 不同物种中的同源基因的外显子序列通常是保守的。尤其是编码区内的外显子具有很强的保守性,但处于5和3非编码区的外显子有时会发生变化。2.外显子对应基因的功能性单位外显子与蛋白质的结构域相对应。3.不同基因可能存在相关的外显子不同基因中的某个或某几个外显子可能具有相关性。第27页/共67页三、内含子(内元、Intron)

14、DNA 与成熟RNA间的非对应区域 氨基酸的非编码区(uncoding region)间隔区(spacer)但被转录 原初转录物中通过原初转录物中通过RNARNA拼接反应而被拼接反应而被去除的去除的RNARNA序序列列或基因中与这种或基因中与这种RNARNA序列相对应的序列相对应的DNADNA序列。序列。R R环(环(R-loopR-loop):mRNAmRNA与编码单链与编码单链DNADNA杂交时,不杂交时,不互补的内含子部分形成的环。互补的内含子部分形成的环。第28页/共67页鸡卵清蛋白成熟mRNA与DNA杂交电镜图DNAmRNA第29页/共67页断裂基因前体mRNAIntrons 去除E

15、xons 连接第30页/共67页1.内含子的相位和类型(1 1)内含子相位内含子相位 内含子可以出现在转录本的任何位置,甚至在以后成为密内含子可以出现在转录本的任何位置,甚至在以后成为密码子的三核苷酸之间。码子的三核苷酸之间。若内含子位于一密码子的第三位核苷酸和另一密码子的第若内含子位于一密码子的第三位核苷酸和另一密码子的第一位核苷酸一位核苷酸(即两密码子之间即两密码子之间),则被称为,则被称为0 0位内含子位内含子;相应地,;相应地,位于一密码子的第一位和第二位核苷酸之间的内含子被称为位于一密码子的第一位和第二位核苷酸之间的内含子被称为1 1位位内含子内含子;位于第二和第三位之间时,则被称为

16、;位于第二和第三位之间时,则被称为2 2位内含子位内含子。这在外显子复制中很重要,处于两同相位内含子之间的外显这在外显子复制中很重要,处于两同相位内含子之间的外显子被称为子被称为对称外显子对称外显子,其核苷酸数为,其核苷酸数为3 3的整数倍,它可以被成功的整数倍,它可以被成功复制,不会造成阅读框的推移。相反,复制,不会造成阅读框的推移。相反,非对称外显子非对称外显子是不可复是不可复制的。制的。第31页/共67页2.内含子的特点1 1)不具有序列特异性)不具有序列特异性2 2)同源基因中内含子的位置通常是保守的:)同源基因中内含子的位置通常是保守的:同源基因的断裂发生在相同的位置,但相应内含子的

17、同源基因的断裂发生在相同的位置,但相应内含子的长度变化很大。长度变化很大。3 3)基因的总长度主要由内含子决定)基因的总长度主要由内含子决定4 4)内含子的相对性:)内含子的相对性:一个基因的内含子可能是另一个基因的外显子,一个基因的内含子可能是另一个基因的外显子,所以一些所以一些DNADNA序列可以编码一种以上的蛋白质。序列可以编码一种以上的蛋白质。同一初始转录本产生不同同一初始转录本产生不同mRNAmRNA的剪接方式称为的剪接方式称为可变剪接可变剪接。第32页/共67页 肌钙蛋白基因内含子的可变剪接,产生和两种类型的蛋白第33页/共67页3.内含子存在的意义及与进化的关系有利于储存更多的遗

18、传信息,增加信息量。由于可变剪接的存在.增加了重组概率:基因总长度增加.可变剪接的存在.有利于生物体的变异和进化:增加了重组概率,还会造成基因突变。第34页/共67页 第三节 基因家族和基因簇 (Gene family、Gene cluster)基因家族基因家族(Gene family):真核生物的基因组中许多来源真核生物的基因组中许多来源相同,结构相似、功能相关的相同,结构相似、功能相关的一组基因。一组基因。第35页/共67页一、基因家族1.基因家族的成因基因家族的各个成员都是由某一祖先基因经重复(复制)和突变产生的。2.基因家族的特点基因家族的各个成员之间来源相同,结构相似、功能相关。第3

19、6页/共67页人类珠蛋白基因家族典型的基因家族人类珠蛋白基因家族典型的基因家族血红蛋白血红蛋白珠蛋白珠蛋白血红素血红素 2 2 2 2 不同的亚基由各自的基因编不同的亚基由各自的基因编码码第37页/共67页血红蛋白(Hb)第38页/共67页 发育过程中的珠蛋白的亚基组成发育过程中的珠蛋白的亚基组成两种亚基的编码基因分别形成两个不同的基因簇两种亚基的编码基因分别形成两个不同的基因簇,并存在于不同的染色体上。并存在于不同的染色体上。每个基因簇中的基因按其在发育过程中的表达次序从每个基因簇中的基因按其在发育过程中的表达次序从5353排列在编码链上排列在编码链上(其中包括有功能的基因和假基其中包括有功

20、能的基因和假基因因)2 2 2 22%97%1%2%97%1%类类 链链 类类 链链第39页/共67页第40页/共67页 3.假基因(Pseudogenes):概念:基因组中存在的一段与正常基因非常相似但不能表达的DNA序列。分为两大类:一类保留了相应功能基因的间隔序列;另一类缺少间隔序列,称为加工过的假基因或返座假基因。假基因(pseudogene)具有与功能基因相似的序列,但由于有许多突变以致失去了原有的功能,所以假基因是没有功能的基因,常用表示。第41页/共67页 大部分假基因在染色体上都位于正常基因的附近,但也有位置在不同的染色体上的。假基因和正常基因的结构上的差异包括在不同部位上的程

21、度不等的缺失或插入、在内含子和外显子邻接区中的顺序变化、在5端启动区域的缺陷等。这些变化往往使假基因不能转录形成正常的(mRNA),从而不能表达。第42页/共67页产生方式:复制(duplication)即复制后基因发生序列变化而失去功能,这样产生的假基因带有内含子,称为未加工假基因或复制假基因。返座(retrotransposition)即mRNA转录本经过反转录为cDNA,再插入基因组,由于插入位点不合适或序列发生变化而导致失去功能。这种类型的假基因不含内含子,被称为已加工假基因或返座假基因。第43页/共67页二、基因簇(gene cluster)概念:基因家族中来源相同、结构相似和功能相

22、关的在染色体上彼此紧密连锁的一组基因。它们属于同一个祖先的基因扩增产物,也常常包括一些没有生物功能的假基因。如:编码催化同一新陈代谢途径的不同步骤的酶的结构基因。这些基因各自编码的酶常能组成多酶复合物。细菌同一操纵子中的几个结构基因也可称为基因簇。第44页/共67页串联重复基因簇的特点:各成员之间有高度的序列一致性拷贝数高:几十 几百非转录的间隔区短而一致 组蛋白基因、组蛋白基因、rRNA rRNA 基因和基因和 tRNAtRNA基因基因往往以串联重往往以串联重复基因簇的形式出现。复基因簇的形式出现。正好满足细胞对组蛋白、正好满足细胞对组蛋白、rRNA rRNA 和和 tRNAtRNA的的 的

23、大量需求。的大量需求。由完全相同的基因簇成员所构成。由完全相同的基因簇成员所构成。1.串联重复序列第45页/共67页 a.rRNA 基因家族(rDNA gene family)海胆450copies烟草750 copies果蝇100 copiesT 18s T 5.8s T 28s NT 18s T 5.8s T45s45s41s41s20s20s32s32s28s5.8s18s18s重复单位的组织情况:重复单位的组织情况:一个重复单位内的一个重复单位内的转录转录的间隔区的间隔区(内元)(内元)重复单位之间的重复单位之间的不转录间隔区不转录间隔区第46页/共67页 b.组蛋白基因家族(Hist

24、one gene family)H1H4H2BH3H2A一个重复单位一个重复单位(基因簇基因簇 gene cluster)gene cluster)的组织情况:的组织情况:组织方式因不同生物而异:组织方式因不同生物而异:基因次序、间隔区的长短、重复频率基因次序、间隔区的长短、重复频率不转录间隔区不转录间隔区海胆:海胆:组蛋白基因表达特点:组蛋白基因表达特点:没有内元没有内元 没有多聚没有多聚A A尾巴尾巴第47页/共67页 c.tRNA基因 tRNAtRNA约长约长 70 70 80 bp80 bp,其基因约长,其基因约长140 bp 140 bp(内元内元)串联重复排列,但各重复单位内的各串

25、联重复排列,但各重复单位内的各tRNAtRNA基因可以不同基因可以不同d.5SrRNA基因 简单多基因家族简单多基因家族成簇排列、成簇排列、10102 2 10103 3个拷贝个拷贝123 3 不转录的间隔区1 5S rRNA2 假基因 重复单位间由高 度重复序列隔开第48页/共67页2.卫星DNA(Satellite DNA):将DNA切成数百个碱基对的片段进行氯化铯密度梯度离心时,由于富含AT的简单高度重复序列区段浮力密度较小,因而很容易和总体DNA分开,即常会在主要的DNA带之外有一个次要的带相伴随。根据重复频率和大小可分为卫星DNA小卫星DNA微卫星DNA卫星DNA的重要特征是:序列长

26、且复杂性低。第49页/共67页Mouse genome DNA30%GC in satellite DNACsCl 离心主带卫星带光 的 吸 收 率浮 力 密 度第50页/共67页卫星DNA:一个重复单位长100几百bp,不能转录和翻译,多分布于异染色质的着丝粒区。小卫星DNA:一个重复单位长10100bp,具有高度的可变性,甚至同一群体中个体间重复次数变动很大,所以个体间长度变化很大(DNA长度多态性)但每个小卫星DNA又都存在一段共有的核心序列,长1015bp,富含GC。第51页/共67页 存在于基因组的广泛区域:基因的间隔区,内含子,外显子,调控区。不同物种,微卫星含量不同:真核生物平均

27、50150kb一 个微卫星。不同微卫星在不同物种中丰度不同:哺乳动物基因组中(AC)n最丰富;植物基因组中(AT)n最丰富。真核生物基因组中,二核苷酸微卫星最丰富,三核苷酸微卫星比二核苷酸微卫星低10倍,四核苷酸微卫星更少。微卫星DNA:一个重复单位长10bp以下。第52页/共67页 后两种卫星后两种卫星DNA又称为又称为数目可变的串联重复序列数目可变的串联重复序列(Variable number tandem repeats.VNTR)或或短串联短串联重复序列重复序列(short tandem repeats.STR)第53页/共67页第四节 真核基因组的包装第54页/共67页一、概述:一、

28、概述:*真核真核DNA组蛋白组蛋白 核小体核小体*核小体折叠压积核小体折叠压积 染色质(染色质(chromatin)(还包括非组蛋白和少量的(还包括非组蛋白和少量的RNA)*大部分细胞生活周期里以染色质的形式存在(弥散状)大部分细胞生活周期里以染色质的形式存在(弥散状)M期期染色体形式染色体形式*染色质有两种类型染色质有两种类型 a a、常染色质:密度较低,一部分基因能被表达、常染色质:密度较低,一部分基因能被表达 b b、异染色质:密度较高,不被表达(着丝粒、端粒)、异染色质:密度较高,不被表达(着丝粒、端粒)第55页/共67页第56页/共67页*组蛋白八聚体(组蛋白八聚体(Histone

29、octamer)H2A与与H2B,H3与与H4的亲和力强,的亲和力强,通过通过C端的疏水氨基酸结合端的疏水氨基酸结合 两个两个H3、H4先形成四聚体先形成四聚体 结合两个结合两个H2A和和H2B的异二聚体的异二聚体 组蛋白八聚体组蛋白八聚体 第57页/共67页二、核小体(二、核小体(Nuclearsome)*构成染色质的构成染色质的基本结构单位基本结构单位 *用足量的微球菌核酸酶处理染色质可得到用足量的微球菌核酸酶处理染色质可得到146bpDNA 组蛋白八聚体核小体的核心颗粒,直径约10nm核小体的组成:第58页/共67页 组蛋白八聚体组蛋白八聚体146bp的的核心核心DNA146bp的核心的

30、核心DNA在组蛋白八聚体上盘绕在组蛋白八聚体上盘绕1.8圈圈第59页/共67页核小体组蛋白 H1*组蛋白组蛋白H1把核小体把核小体 “封锁封锁”起来起来第60页/共67页连接 DNA:8 114 bp,平均 55 bp 核小体组蛋白 H1核小体重复单位:核心颗粒+连接 DNA=200 bp三、染色体结构的形成三、染色体结构的形成1 1、首先若干个核小体形成念珠状结构首先若干个核小体形成念珠状结构 一级结构一级结构 第61页/共67页每个核小体单位每个核小体单位包括:包括:200bp左右左右的的DNA、一个组、一个组蛋白八聚体、一蛋白八聚体、一分子分子H1第62页/共67页 高度有序 左手螺旋 每圈包括六个核小体 30 nm螺线管(直径30nm)2、30nm中空螺线管的构成中空螺线管的构成二级结构二级结构第63页/共67页Nuclear matrix(核基质),protein complex30 nm 螺线管300 nm3、300nm超螺线管的形成三级结构超螺线管(4)染色单体的形成四级结构第64页/共67页从DNA到染色体的过程包装比:DNA的总长度除以包装后长度的比值。包装比=7000一级结构二级结构三级结构四级结构第65页/共67页本章内容结束本章内容结束!第66页/共67页谢谢您的观看!第67页/共67页

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 应用文书 > PPT文档

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁