《基因与基因组(3).ppt》由会员分享,可在线阅读,更多相关《基因与基因组(3).ppt(115页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于基因和基因组(3)第一张,PPT共一百一十五页,创作于2022年6月基因组(genome)是细胞或生物体的全套遗传物质。就细菌和噬菌体而言,它们的基基因因组组是是指指单单个个染染色色体体上上所所含含的的全全部部基基因因,而二倍体真核生物的基因组则是指维持配子或配子体正常功能的最基本的一套染色体及其所携带的全部基因。第二张,PPT共一百一十五页,创作于2022年6月v染色体与染色体与DNA的关系的关系染色体是遗传物质的染色体是遗传物质的主要主要载体载体,也就是,也就是说细胞内的说细胞内的DNA主要在染色体上主要在染色体上。(注意染色体外遗传基因的概念)注意染色体外遗传基因的概念)一、一、染色
2、体概述染色体概述v什么是染色质?什么是染色质?染色质与染色体是同一种物质,在不同时染色质与染色体是同一种物质,在不同时期有不同的表现形式。期有不同的表现形式。第三张,PPT共一百一十五页,创作于2022年6月常染色质和异染色质常染色质和异染色质常染色质和异染色质常染色质和异染色质常染色质常染色质(euchromatin)(euchromatin):细:细胞间期核内呈伸展状态,染胞间期核内呈伸展状态,染色较浅且具有转录活性的染色较浅且具有转录活性的染色质。色质。异染色质异染色质(heterochromatin)(heterochromatin):细胞间期核内呈凝集状态,细胞间期核内呈凝集状态,染
3、色较深且没有转录活性的染色较深且没有转录活性的染色质。染色质。第四张,PPT共一百一十五页,创作于2022年6月原核细胞原核细胞第五张,PPT共一百一十五页,创作于2022年6月v原核生物原核生物DNA一般位于核区里(一般位于核区里(拟核拟核)。细菌)。细菌DNA是一条共价、闭合双链分子,通常也称为染是一条共价、闭合双链分子,通常也称为染色体。一般情况下含有色体。一般情况下含有一条染色体一条染色体。原核细胞都。原核细胞都是是单倍的单倍的。大都带有。大都带有单拷贝基因单拷贝基因;整个染色体;整个染色体DNA几乎全部由功能基因与调控序列所组成;几乎全部由功能基因与调控序列所组成;几乎每个基因序列都
4、与它所编码的蛋白质序列几乎每个基因序列都与它所编码的蛋白质序列呈线性对应状态。(无内含子)呈线性对应状态。(无内含子)第六张,PPT共一百一十五页,创作于2022年6月真核细胞真核细胞第七张,PPT共一百一十五页,创作于2022年6月原核细胞与真核细胞的主要区别原核细胞与真核细胞的主要区别细胞大小细胞大小较小,较小,110m较大,较大,10100m内膜系统内膜系统无无有有细胞骨架细胞骨架无无有有细胞核细胞核拟核(无核膜核仁拟核(无核膜核仁)有核膜核仁有核膜核仁染色体染色体单数单数,非组蛋白,非组蛋白多个多个,组蛋白组蛋白及非组及非组与单个与单个DNA组成组成特征特征 原核细胞原核细胞真核细胞真
5、核细胞蛋白与多个蛋白与多个DNA组成组成第八张,PPT共一百一十五页,创作于2022年6月染色体上的染色体上的DNA存在形式不同存在形式不同第九张,PPT共一百一十五页,创作于2022年6月端粒端粒端粒端粒人人类类染染色色体体形形态态结结构构第十张,PPT共一百一十五页,创作于2022年6月v真核细胞染色体特征真核细胞染色体特征:真核细胞的真核细胞的体细胞体细胞染色体都是二倍体,染色体都是二倍体,而性细而性细胞的染色体为单倍体。胞的染色体为单倍体。1、分子结构和数目相对稳定、分子结构和数目相对稳定;2、能够自我复制、能够自我复制;3、能够指导蛋白质的合成,从而控制整个生命过程、能够指导蛋白质的
6、合成,从而控制整个生命过程;4、能够产生遗传的变异。、能够产生遗传的变异。第十一张,PPT共一百一十五页,创作于2022年6月二、真核生物基因组二、真核生物基因组(一)概述(一)概述真真核核生生物物的的遗遗传传物物质质主主要要集集中中在在核核膜膜包包围围着着的的细细胞胞核核中中,DNA和和特特殊殊的的蛋蛋白白质质相相结结合合组组装装成成为为染染色色体体。在在真真核核细细胞胞中中每每条条染染色色体由一个体由一个DNA分子组成。分子组成。第十二张,PPT共一百一十五页,创作于2022年6月真核生物的基因组一般比较庞大,例如人的单倍体基因组由3109 bp碱基组成,按1000个碱基编码一种蛋白质计,
7、理论上可有300万个基因。但实际上,人细胞中所含基因总数大概不会超过4万个。这就说明在人细胞基因组中有许多DNA序列并不转录成mRNA用于指导蛋白质的合成。DNA的复性动力学研究发现这些非编码区往往都是一些大量的重复序列,这些重复序列或集中成簇,或分散在基因之间。第十三张,PPT共一百一十五页,创作于2022年6月在基因内部也有许多能转录但不翻译的间隔序列(内含子)。因此,在人细胞的整个基因组当中只有很少一部份(约占2-3)的DNA序列用以编码蛋白质。真核生物基因组有以下特点:真核生物基因组有以下特点:1.真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因
8、的基因组是双份的(即双倍体,diploid),即有两份同源的基因组。第十四张,PPT共一百一十五页,创作于2022年6月2.真核细胞基因转录产物为单顺反子。一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。3.存在重复序列,重复次数可达百万次以上。4.基因组中不编码的区域多于编码区域。5.大部分基因含有内含子,因此,基因是不连续的。第十五张,PPT共一百一十五页,创作于2022年6月6.基因组远远大于原核生物的基因组,具有许多复制起点,而每个复制子的长度较小。第十六张,PPT共一百一十五页,创作于2022年6月(二)、真核生物基因组的(二)、真核生物基因组的C C值悖理值悖理真核生物
9、基因组较原核生物大得多,真核生物基因组来源不同,分子量差别也很大。与大肠杆菌染色体DNA分子量相比,果蝇染色体DNA分子量差不多是大肠杆菌染色体DNA的300倍。而人含有比大肠杆菌多600800倍的DNA。我们把一个物种单倍体基因组的DNA含量,通常称为该物种的C值。每个物种的C值是相对恒定的,第十七张,PPT共一百一十五页,创作于2022年6月不同物种的C值差异极大,虽然DNA的含量与物种间的差异有一定关系,但与物种间的复杂性并没有严格的对应关系,这从不同物种的单倍体基因组的C值(DNA数量)的比较中可以明显看出。例如昆虫的C值大约是108碱基对,而两栖类动物如两栖鲵(amphiuma)的C
10、值是8.61010碱基对。在昆虫与两栖类之间,C值相差近千倍,而且两栖类的C值竟然第十八张,PPT共一百一十五页,创作于2022年6月比包括人类在内的哺乳类(3109 bp)的C值还高,所以很难令人相信这样的差异与生物复杂性有什么关系。我们很难解释牛与人的DNA含量相等,而豌豆与蚕豆DNA含量却相差7倍。这种C值与生物进化复杂性不相对应的现象称为C值悖理(C value paradox),这暗示着真核生物基因组中必然存在大量的不编码基因产物的DNA序列。第十九张,PPT共一百一十五页,创作于2022年6月(三)真核生物染色体组成(三)真核生物染色体组成DNA组蛋白组蛋白非组蛋白非组蛋白少量少量
11、RNA化化学学成成分分第二十张,PPT共一百一十五页,创作于2022年6月v组蛋白:组蛋白:Hl、H2A、H2B、H3及及H41、染色体中的蛋白质染色体中的蛋白质第二十一张,PPT共一百一十五页,创作于2022年6月组蛋白的一般特性组蛋白的一般特性进化上的极端保守性进化上的极端保守性 牛、猪、大鼠的牛、猪、大鼠的H4H4氨基酸序氨基酸序列完全相同。牛的列完全相同。牛的H4H4序列与豌豆序列相比只有两个序列与豌豆序列相比只有两个氨基酸的差异(豌豆氨基酸的差异(豌豆H4H4中的异亮氨基酸中的异亮氨基酸60缬氨酸缬氨酸60,精氨酸,精氨酸77赖氨酸赖氨酸77)。)。H3H3的保守性也很大,鲤的保守性
12、也很大,鲤鱼与小牛胸腺的鱼与小牛胸腺的H3H3只差一个氨基酸,小牛胸腺与豌只差一个氨基酸,小牛胸腺与豌豆豆H3H3只差只差4 4个氨基酸。个氨基酸。无组织特异性无组织特异性 到目前为止,仅发现鸟类、鱼到目前为止,仅发现鸟类、鱼类及两栖类红细胞染色体不含类及两栖类红细胞染色体不含H1H1而带有而带有H5H5,精细,精细胞染色体的组蛋白是鱼精蛋白。胞染色体的组蛋白是鱼精蛋白。第二十二张,PPT共一百一十五页,创作于2022年6月肽链上氨基酸分布的不对称性肽链上氨基酸分布的不对称性碱性氨基酸碱性氨基酸集中分布在集中分布在N端的半条链上。例如,端的半条链上。例如,N端的半条链上端的半条链上净电荷为净电
13、荷为+16,C端只有端只有+3,大部分疏水基团都分布在,大部分疏水基团都分布在C端。端。组蛋白的修饰作用组蛋白的修饰作用包括甲基化、乙基化、磷酸化及包括甲基化、乙基化、磷酸化及ADP核糖基化等。核糖基化等。富含赖氨酸的组蛋白富含赖氨酸的组蛋白H5鸟类、两栖类、鱼类红细鸟类、两栖类、鱼类红细胞分离的胞分离的H5均有种的特异性。均有种的特异性。第二十三张,PPT共一百一十五页,创作于2022年6月v非组蛋白非组蛋白非组蛋白:非组蛋白:酶类、收缩蛋白、骨架蛋白、肌动蛋白、酶类、收缩蛋白、骨架蛋白、肌动蛋白、肌球蛋白、微管蛋白、肌原蛋白等。肌球蛋白、微管蛋白、肌原蛋白等。v一般特性:一般特性:非组蛋白
14、的多样性非组蛋白的多样性非组蛋白的量大约是组蛋白的非组蛋白的量大约是组蛋白的60%70%,但它的种,但它的种类却很多,约在类却很多,约在20-100种之间,其中常见的有种之间,其中常见的有15-20种。种。非组蛋白的组织专一性和种属专一性非组蛋白的组织专一性和种属专一性第二十四张,PPT共一百一十五页,创作于2022年6月常见的非组蛋白常见的非组蛋白a.HMG蛋白蛋白(highmobilitygroupprotein)这是一类能用低盐(这是一类能用低盐(0.35mol/LNaCl)溶液抽提、能溶于)溶液抽提、能溶于2%的三氯的三氯乙酸、相对分子质量较低的非组蛋白,相对分子质量都在乙酸、相对分子
15、质量较低的非组蛋白,相对分子质量都在3.0104以以下。这类蛋白能与下。这类蛋白能与DNA结合,也能与结合,也能与Hl作用,但很容易用低盐作用,但很容易用低盐溶液抽提,说明它们与溶液抽提,说明它们与DNA结合并不牢固。其功能可能与结合并不牢固。其功能可能与DNA的超螺旋结构有关。的超螺旋结构有关。b.DNA结合蛋白结合蛋白用用2mol/LNaCl除去全部组蛋白和除去全部组蛋白和70%非组蛋白后,还有一部非组蛋白后,还有一部分蛋白必须用分蛋白必须用2mol/LNaCl和和5mol/L尿素才能与尿素才能与DNA解离。说明解离。说明这些蛋白与这些蛋白与DNA结合比较紧密。其功能可能与结合比较紧密。其
16、功能可能与DNA的复制和转的复制和转录有关。录有关。第二十五张,PPT共一百一十五页,创作于2022年6月2、染色体中的染色体中的DNAv真核细胞基因组含有大量的真核细胞基因组含有大量的重复序列重复序列,功能功能DNA序列大多被非功能序列大多被非功能DNA所所隔开。许多隔开。许多DNA序列不编码蛋白质。序列不编码蛋白质。这就是著名的这就是著名的C值反常值反常现象。现象。第二十六张,PPT共一百一十五页,创作于2022年6月外显子外显子外显子外显子内含子内含子内含子内含子真核细胞基因的结构真核细胞基因的结构第二十七张,PPT共一百一十五页,创作于2022年6月3.DNA序列的类型序列的类型真核生
17、物的一个显著特点就是富含重复序列这些重复序列的长短不同,短的仅有几个甚至两个核苷酸,长的有几百乃至上千个核苷酸。重复序列的重复程度也不一样。重复多的可在基因组中出现几十万到几百万次,称为高度重复序列。重复几十到几千次称中度重复序列。重复极少称为轻度重复序列。不重复的序列则称为单一序列或单拷贝序列。第二十八张,PPT共一百一十五页,创作于2022年6月第二十九张,PPT共一百一十五页,创作于2022年6月第三十张,PPT共一百一十五页,创作于2022年6月1)单拷贝序列(single copy sequence)或单单一序列(一序列(uniquesequence)真核生物的大多数基因在单倍体中都
18、是单拷贝的。单拷贝序列最重要的作用是具有编码功能。在单倍体基因组里,这些序列包括编码蛋白质和酶的结构基因以及基因的间隔序列。不重复序列长约7502000 bp,相当于一个结构基因的长度,这类序列的cot值与基因组中DNA的含量成正比。真核生物基因组中单拷贝序列约在4070,但编码序列只占单拷贝序列的一小部分,所以单拷贝序列除了编码以外还应有其它功能。第三十一张,PPT共一百一十五页,创作于2022年6月2 2)轻轻 度度 重重 复复 序序 列列(slightly slightly repetitive repetitive sequencesequence)这种重复序列在基因组中只有210个拷
19、贝,主要是组蛋白和tRNA基因。轻度重复序列包括两种情况:一是重复序列中的基因都是有功能的,例如血红蛋白链的基因有胚胎型和胎儿型,只是基因产物在氨基酸组成上是各有差异;二是重复序列中的基因有的有功能,有的没有功能,如假基因等。轻度重复序列很难用点突变方法进行鉴定,因为任何一个拷贝的失活都不能影响其它拷贝的活性。第三十二张,PPT共一百一十五页,创作于2022年6月3 3)中度重复序列(中度重复序列(moderately repetitive moderately repetitive sequencesequence)中度重复序列一般都是不编码的序列,有几十至数千个拷贝,例如rRNA基因和tR
20、NA基因等。目前认为,大部分中度重复序列与基因表达的调控有关,它们可能是与DNA复制、转录起始和终止有关的酶及蛋白质因子的识别位点。有短周期的分散重复序列和长周期的分散重复序列两类中度重复序列:第三十三张,PPT共一百一十五页,创作于2022年6月A.短周期的分散重复序列,每个序列长约100300bp,主要在人、爪蟾和海胆等中已有发现;B.长周期的分散重复序列,每个大约5000bp。长、短周期的中度重复序列的共同特征是两端有类似于转座子两端的重复序列,这种现象十分类似于逆转录病毒的结构。第三十四张,PPT共一百一十五页,创作于2022年6月4 4)高度重复序列(高度重复序列(highly re
21、petitive highly repetitive sequencesequence)大多数高等真核生物的DNA都含有20以上的高度重复序列,由非常短的序列重复多次,可达几百万个拷贝,串联成长长的一大簇集中在异染色质区,特别是在着丝粒和端粒附近。在这些高度重复序列中,常有一些AT含量很高的简单高度重复序列,因为序列简单,缺乏转录必要的启动子而不具转录能力。第三十五张,PPT共一百一十五页,创作于2022年6月第三十六张,PPT共一百一十五页,创作于2022年6月高度重复高度重复DNA中度重复中度重复DNA重复单位重复单位6100bp300bp7000bp重复次数重复次数10610810110
22、4举例举例端粒、着丝粒端粒、着丝粒人人Alu家族家族第三十七张,PPT共一百一十五页,创作于2022年6月5)5)、串联重复序列、串联重复序列真核生物基因组中的重复序列,根据其在基因组中的分布方式又可分为两类:一类散在基因组中,称为散在重复序列,如Alu家族;另一类重复单位呈串联状,首尾相连排列在一起,称为串联重复序列。卫星、小卫星和微卫星是串联重复序列中最常见的三种类型。第三十八张,PPT共一百一十五页,创作于2022年6月A、卫星序列(、卫星序列(satellite sequencesatellite sequence)当把断成约104 bp的DNA片段进行氯化铯(CsCl)密度梯度离心分
23、析时,发现除了一个主要的 DNA主峰外,旁边还出现不同密度的小峰。这些小峰就像是主峰旁边的卫星,因此命名为卫星DNA。第三十九张,PPT共一百一十五页,创作于2022年6月果蝇(果蝇(D.virilis)的卫星的卫星DNA第四十张,PPT共一百一十五页,创作于2022年6月卫星序列是由寡核苷酸串联、重复排列构成数量可变的串联重复序列(variable number of tandem repents,VNTR)。该区AT含量高,其中重 复 序 列 为 6 70bp的 称 为 小 卫 星DNA(minisatellite DNA),它常位于染色体端粒和着丝区,带有GCTGGGCAGARG(R嘌呤
24、)的核心同源序列,因此,探针杂交图谱具有极强的个体特异性,称之为“DNA指纹图谱”。第四十一张,PPT共一百一十五页,创作于2022年6月 检测小卫星序列的方法称“DNA指纹技术”。在基因组的间隔序列和内含子等非编码区内,广泛存在着比小卫星DNA序列更短的一类小重复单位。重复序列为16bp称为微卫星DNA(microsatellite DNA),如(A)n/(T)n、(CA)n/(TG)n、(CT)n/(AG)n等。它均匀遍布于基因组中,是重复序列中主要组成部分之一,呈共显性遗传。微卫星序列的拷贝数在个体间呈现高度变异,因而具有高度多态性,已经成为真核生物 第四十二张,PPT共一百一十五页,创
25、作于2022年6月基因组绘制遗传图的重要分子标志。原位杂交技术显示大量的卫星DNA容易在中期着丝粒周围集中。推测它作用于DNA复制结束时分开姊妹染色单体缠绕成DNA双链的起始点,并认为卫星DNA是DNA聚合酶识别的核苷酸序列,因为着丝粒是复制最快的DNA序列。第四十三张,PPT共一百一十五页,创作于2022年6月B.AluAlu家族,分散重复家族,分散重复DNADNAAlu家族(Alu family)属于中度重复序列中最为普遍的一类,也是研究最多的一种散在型重复序列。由于此序列中含有限制性内切酶Alu特异识别顺序(AGCT)而得名。Alu家族在人类基因组中含量最丰富,平均每6 kb 的DNA就
26、有一个,重复序列为300bp,此序列可被Alu内切酶切成130bp和170bp两个片断是其家族的共同特征。第四十四张,PPT共一百一十五页,创作于2022年6月Alu家族在人类基因组中的重复频率为3105,约占人类基因组的3%6%。Alu家族中有80%88%同源性,它们之间的差别多为点突变。人类Alu家族DNA的5 端都有较精确的序列,但其3 端区长短不一。两端都具有720bp的顺向重复序列,各个Alu成员两端的顺向重复序列都有差异。第四十五张,PPT共一百一十五页,创作于2022年6月Alu序列由左右两个单体串联构成,前单体长135bp,含有RNA聚合酶的转录控制区,后单体长165bp,由于
27、其中插入了另外的30bp无关序列,致使此聚合酶控制区失效。Alu家族的具体作用仍不清楚,但Alu序列中有一个14bp区域与某些病毒(papova,heputitisB)中的复制起始的序列相同,因此推测Alu家族与真核细胞基因组的复制起始点有关。第四十六张,PPT共一百一十五页,创作于2022年6月另外,有些Alu家族成员可在试管中被RNA聚合酶转录为小的RNA,此类转录单位往往位于其它转录单位附近。例如在人-球蛋白基因群内就有两个这样的转录单元。而另一些Alu家族成员往往包含在结构基因转录单位之内,例如在细胞核RNA(nuclear RNA,nRNA)之中。在一个nRNA分子内存在着多个Alu
28、拷贝将有助于该nRNA分子二级结构的形成。第四十七张,PPT共一百一十五页,创作于2022年6月所有这些暗示Alu家族成员可能与基因的转录、调控有关。同时,Alu家族成员是可移动的成分。Alu的转位与共转录过程结合进行,它们以RNA为中间体,自我引物,逆转录成cDNA,然后插入另一位置,成为新的转录单位。这种Alu成分的转位会引起DNA的重排,从而影响细胞的分化。第四十八张,PPT共一百一十五页,创作于2022年6月6)6)、基因家族和基因簇、基因家族和基因簇真核细胞中许多相关的基因常常按功能成套组合,一套基因就是所谓的一个基因家族(gene family)。一个基因家族中各成员表达产物的结构
29、和功能是密切相关的,但其表达调控和表达水平以及表达产物的活性可能很不相同,它们可以分散在同一染色体的不同部位,甚至位于不同的染色体上。基因家族通常可以分为简单多基因家族、复杂多基因家族和受发育调控的复杂多基因家族。第四十九张,PPT共一百一十五页,创作于2022年6月一个家族的成员可以在染色体上紧密地排列在一起,成为一簇,称为基因簇(gene cluster)。在人类基因组中有12个大的基因簇,如-珠蛋白基因簇、-珠蛋白基因簇和组蛋白基因簇等。A.A.简单多基因家族简单多基因家族简简单单多多基基因因家家族族是是指指由由一一个个或或数数个个基基因因以以串串联联方方式式重重复复排排列列,各各个个基
30、基因因含含有有单单一一的的转转录录单单元元和和非非转转录录区区。编码5SrRNA的基因是一个典型的简单多基因家族。第五十张,PPT共一百一十五页,创作于2022年6月在高等真核生物中,有4种rRNA,即28S、18S、5.8S和5SrRNA。前三种为主体rRNA,它们的基因组成重复单元由RNA聚合酶共转录成一个大分子量的rRNA前体,然后再切割成3个独立的rRNA分子。5SrRNA基因是独立的串联重复单位,受另一个启动子的控制,每个重复单元由5SrRNA基因和转录区之前的非转录区组成。重复单元拷贝数差异很大,例如非洲爪蟾约有2万个5SrRNA基因拷贝。第五十一张,PPT共一百一十五页,创作于2
31、022年6月非洲爪蟾卵母细胞型非洲爪蟾卵母细胞型5SrRNA基因放入串联重复单基因放入串联重复单元元第五十二张,PPT共一百一十五页,创作于2022年6月非洲爪蟾的非洲爪蟾的18S、5.8S及及28SrRNA基因是连在一起的,中间基因是连在一起的,中间隔着不转录的间隔区,这些单位在隔着不转录的间隔区,这些单位在DNA链上串联重复约链上串联重复约5000次次。在卵细胞形成过程中这些基因可进行几千次不同比例的复。在卵细胞形成过程中这些基因可进行几千次不同比例的复制,产生制,产生2106个拷贝,使个拷贝,使rDNA占卵细胞占卵细胞DNA的的75%,从而,从而使该细胞能积累使该细胞能积累1012个核糖
32、体。个核糖体。第五十三张,PPT共一百一十五页,创作于2022年6月 一种是卵母细胞型,一种是体细胞型,大多数是后一种类型,构成一个或几个基因簇,几乎所有染色体上都有5SrRNA基因家簇。这么大的数目足以满足卵子发生时期蛋白质迅速合成的要求。B.B.复杂的多基因家族复杂的多基因家族 复杂的多基因家族由几个相相关关基基因因家家族族构构成成,基因家族间由间隔序列分开并作为独立的单位被转录。组蛋白基因(H1、H4、H2B、H3、H2A)都属于这一类型。第五十四张,PPT共一百一十五页,创作于2022年6月组蛋白基因结构示意图组蛋白基因结构示意图 海胆和果蝇组蛋白基因家族的示意图。第五十五张,PPT共
33、一百一十五页,创作于2022年6月海胆的5种主要组蛋白的基因串联构成一个单元,它们多拷贝组成串联的重复基因簇,在整个海胆基因组中重复约1000次。基因簇中每一个基因分别被转录成单顺反子RNA,没有内含子,而且各基因在同一条DNA链上按同一方向转录,每个基因转录和翻译的速度都受到调节。在不同组织中以及发育的不同时期表达不同套的组蛋白基因。第五十六张,PPT共一百一十五页,创作于2022年6月果蝇中这5种组蛋白的基因也是成簇并串联重复,但基因簇中每个基因都按照各自的方向进行转录。组蛋白基因家族是重复序列中唯一已知具有蛋白质编码功能的基因。组蛋白基因在DNA开始合成前短暂地表达,基因活性与细胞周期密
34、切相关,当一段DNA被复制出来,马上就有组蛋白与它偶联形成核小体。因此,在合成DNA的短时间内必须大量合成组蛋白,这可能是组蛋白基因串联成簇的一个原因。第五十七张,PPT共一百一十五页,创作于2022年6月C.受发育调控的复杂多基因家族受发育调控的复杂多基因家族 人类珠蛋白基因家族是典型的由发育调控的复杂多基因家族。人类珠蛋白基因簇有二种类型:-珠蛋白基因簇和-珠蛋白基因簇。-珠蛋白基因簇位于16号染色体上,包包括括一一个个活活化化的的,一一个个假假基基因因,2 2个个基基因因,2 2个个假假基基因因和和一一个个未未知知功功能能的的基基因因,两两个个基基因因编编码码同同样样的的蛋蛋白白质质。-
35、珠珠蛋蛋白白基基因因位位于于1111号号染染色体上,大约色体上,大约50 50 kbkb长,长,第五十八张,PPT共一百一十五页,创作于2022年6月珠蛋白基因家族结构图珠蛋白基因家族结构图第五十九张,PPT共一百一十五页,创作于2022年6月包包括括5 5个个有有功功能能的的基基因因(、22、和和),还还有有一一个个假假基基因因。两两个个基基因因编编码码的的蛋蛋白白只只有有一一个个氨氨基基酸酸残残基基的的差差别别,即即G G蛋蛋白白在在1313位位是是甘甘氨氨酸酸,而而A A蛋蛋白白在在这这个个位位置置上上是是丙丙氨氨酸酸。在在发发育育的的不不同同阶阶段段,由由不不同同的的类类和和类类亚亚基
36、基各各两两个个组组成成血血红红蛋白的蛋白的四聚体四聚体(表)。(表)。第六十张,PPT共一百一十五页,创作于2022年6月胚胎期(胚胎期(8周以前)周以前)HbGower1HbGower2HbPortland胎儿期(胎儿期(841周)周)HbF成人期成人期HbA(98%)HbA2(2)222222222222表表 表明了不同发育阶段血红蛋白的亚基组表明了不同发育阶段血红蛋白的亚基组成成第六十一张,PPT共一百一十五页,创作于2022年6月人珠蛋白基因家族人珠蛋白基因家族包括:包括:珠蛋白珠蛋白基因簇基因簇和和珠蛋白珠蛋白基因簇基因簇第六十二张,PPT共一百一十五页,创作于2022年6月在人类珠
37、蛋白基因簇中,基因排列的方式与它们在个体发育阶段表达的顺序一致。首先是胚胎期表达的基因,然后是胎儿期、成年期的基因。在簇中,胚胎的链基因在2个链(2和1)基因的前面,2和1分别是胎儿和成年血红蛋白的成分;在簇中,胚胎的链基因排在最前面,接着是胎儿的2个链基因,最后是成年的和链基因。-珠珠蛋蛋白白基基因因簇簇和和-珠珠蛋蛋白白基基因簇都是从左至右依次转录的。因簇都是从左至右依次转录的。第六十三张,PPT共一百一十五页,创作于2022年6月7)7)、假基因、假基因在多基因家族中,某些成员并不产生有功能的基因产物,但其结构和DNA序列与有功能的基因具有相似性。这些基因称为假基因。假基因常用符号来表示
38、。如珠蛋白基因簇中的1表示与1基因相似的假基因。假基因与有功能的基因同源,原来也可以是有功能的基因,由于发生缺失(deletion)、第六十四张,PPT共一百一十五页,创作于2022年6月倒倒位位(inversion)inversion)与与点点突突变变(point point mutation)mutation)等等,使这一基因失去活性,成为无功能的基因,即形成了假基因。假基因的概念是1977年G.Jacq等人根据对非洲爪蟾5SrRNA基因簇的研究提出的。5SrRNA基因重复单位约700bp,其中有活性的编码序列约120bp,而相邻的一个有101bp的序列的基因与具有编码活性序列的5S基因的
39、前101碱基序列是完全相同的,第六十五张,PPT共一百一十五页,创作于2022年6月但缺少了缺少了1919bpbp片断片断。所以在体内从未检测出过这段与5SrRNA基因的复本序列基本相同的基因转录出的rRNA,说明它是没有表达活性的,DNA序列分析表明:这个假基因上缺乏正常转录的起始信号。许多假基因都是同“亲本基因”(parental gene)连锁的,而且共同编码区及侧翼序列的DNA具有很高的同源性。珠蛋白基因家族中的假基因是研究的第六十六张,PPT共一百一十五页,创作于2022年6月较为深入的例子。基因家族中的假基因、1和2。1同3个有功能的-珠蛋白的基因密切相关,将1假基因的核苷酸序列同
40、2功能基因比较发现,两者在上游序列及间隔序列的同源性达73。据此可知,1假基因是2功能基因突变而来的,由于碱基突变而不能产生有功能的蛋白质。在家族中,假基因1的结构特点是:第六十七张,PPT共一百一十五页,创作于2022年6月(1)缺乏内含子剪接加工的5,共同序列;(2)PolyA的信号由AATAAA突变成AATGAA;(3)转录起始密码子ATG为GTG所取代;(4)从38氨基酸开始有20个核苷酸缺失,造成一个终止密码,使肽链提前终止。根据珠蛋白的情况推断,每4个基因序列中就可能存在有一个假基因。随着分析技术的提高,会对较小的基因簇进行鉴定,发现更多的假基因。第六十八张,PPT共一百一十五页,
41、创作于2022年6月8)8)、断裂基因、断裂基因 一个基因的核苷酸序列中因插入了与编码氨基酸无关的核苷酸序列,使一个完整的基因分隔成不连续的若干区段,我们称之为断裂基因(split gene)。1997年Roberts和Sharp实验室在研究腺病毒(adenovirus)的mRNA合成时,发现病毒的双链DNA与它的mRNA进行分子杂交时,在电镜下发现杂交链中有一个个第六十九张,PPT共一百一十五页,创作于2022年6月突起的环,这环就是不能与mRNA互补配对的部分。这一发现打破了每个结构基因是一段连续发现打破了每个结构基因是一段连续DNADNA序列序列的传统观念的传统观念,使人们对基因结构的认
42、识产生了一次新的飞跃,因而他们两人获得了1993年诺贝尔生理学与医学奖。断裂基因中的序列有两部分,一部分为表达序列,即转录后在成熟的RNA中存在,称之为外显子(extron)。第七十张,PPT共一百一十五页,创作于2022年6月另一部分为不表达序列,即在mRNA成熟加工过程中被除去,称之为内含子(intron)。断裂基因的整个表达程序为:内含子和外显子都被转录下来,称为初初级级转转录录物物,即核内不均一RNA(hnRNA),又叫前前体体mRNAmRNA。在核内经过转录后加工,除除去去内含子,拼接成成熟的mRNA输送到细胞质,再翻译成多肽链。这些内含子的删除和外外显显子子的的连连接接,最后第七十
43、一张,PPT共一百一十五页,创作于2022年6月形 成 成 熟 的RNA的 过 程 称 为RNA剪 辑(RNA splicing)。当成熟的mRNA与原基因片段杂交时,内含子缺少互补序列而环凸出来。如sharp等把分离出的组成腺病毒颗粒体的六邻体mRNA与腺病毒DNA进行杂交,在电子显微镜下观察,发现单链DNA中有三处核苷酸序列没有相应的mRNA核苷酸序列与之配对而呈环状结构(A、B和C),这些环状结构即为内含子序列。因成熟的mRNA中这些序列第七十二张,PPT共一百一十五页,创作于2022年6月腺病毒六邻体腺病毒六邻体mRNA与其与其DNA杂交图杂交图图释.a.腺病毒DNA ECORI酶切A
44、片段,该片段从病毒DNA的左端开始,在六邻体基因最后一个外显子的ECORI酶切部位切断。六邻体基因由三个内含子(1kb、5kb和9kb)、3个短外显子和一个长外显子(约3.5kb)组成。b.六邻体基因成熟mRNA和DNA ECORI酶切片段的杂合子结构模式图。A、B、C分别表示三个内含子。第七十三张,PPT共一百一十五页,创作于2022年6月已经被删除,所以杂交后DNA上的这些序列环凸出来。基基因因的的不不连连续续性性是是真真核核基基因因独独特特的的,但但是是不不连连续性并不是所有真核基因中都可以找到的续性并不是所有真核基因中都可以找到的。A.A.内含子内含子不同的断裂基因中内含子的个数和大小
45、区别很大。基因的大小很大程度上决定于其内含子的个数和每个内含子的大小。内含子的转录消耗了细胞的资源和能量,如果对机体没有任何益处,进化是不会选择断裂基因的。第七十四张,PPT共一百一十五页,创作于2022年6月所以就目前人们的认识,内含子具有以下功能内含子具有以下功能:1内含子可能携带某些信号作为基因的调控元件。内含子中存在许多重复序列,这些多重复内含子的旁侧序列可能作为遗传调控元件。2内含子具有各种剪接信号,通过对外显子的选择性拼接,可以使一个基因产生多种基因产物。第七十五张,PPT共一百一十五页,创作于2022年6月3内含子有自己特定的蛋白质编码。4内含子在遗传上可以稳定基因簇。B.B.外
46、显子外显子 在DNA分子水平的基因概念(参第一节)中,我们已知道一个外显子相当于蛋白质的一个结构域。结构域是一种介于蛋白质二级结构和三级结构之间存在的另一种结构层次,是指蛋白质中一些相邻的二级结构片断聚集在一起形成在空间第七十六张,PPT共一百一十五页,创作于2022年6月上可明显区分的、相对独立的区域性结构。结构域自身是紧密装配的,但结构域与结构域之间关系松懈。两个结构域之间常有一段长度不等的肽链相连,形成所谓的铰链区(hinge region),使两个结构域很容易发生相对运动。从蛋蛋白白质质三三级级结结构构及及其其基基因因内内含含子子、外外显显子子分分布布的的许许多多例例子子中中,可可以以
47、观观察察到到有有些些外外显显子子表表达达出出的的多多肽肽链链经经折折叠叠经经常常相相当当于于一一个个结结构构域域,外显子的边界非常精确地相当于结构域之间的联结处。第七十七张,PPT共一百一十五页,创作于2022年6月4、真核生物基因组的包装、真核生物基因组的包装 真核生物细胞DNA的总长度因不同的种而异,但与原核基因组相比,要大数千倍,每条染色体中的DNA为单一线性DNA分子,长度可达几厘米,它们必须以高高度度浓浓缩缩的的形形式式被被装装进进直直径径约约5 51010m m的细胞核内的细胞核内。真核生物基因组DNA被压缩的第一步是形成核小体(nucleosome)的重复单位,第七十八张,PPT
48、共一百一十五页,创作于2022年6月 这也是染色质结构的基本单位。用一种切割双链DNA的内切酶微球菌核酸酶消化染色质,可以获得单个的核小体,每个核小体是由大约核小体是由大约200200bpbp的的DNADNA环绕环绕4 4种组蛋白种组蛋白 (H2AH2A,H2BH2B,H3H3,H4H4)每种每种2 2个拷个拷贝组成的八聚体贝组成的八聚体。其中146 bp紧紧缠绕着组蛋白八聚体核心,其余的用于连系两个核小体,称为连接DNA。组蛋白H1不参与核小体的组成,而与连接DNA相结合。第七十九张,PPT共一百一十五页,创作于2022年6月这些蛋白质保护DNA免受微球菌核酸酶的作用。在核酸酶的连续消化作用
49、下,组蛋白Hl丢失,得到抗性极强的核小体核心核小体核心(nucleosome core)。不论染色体源于何处,都具有相似的核小体结构。核小体的组装分三步三步,即两对两对H H3 3、H H4 4组蛋白组组蛋白组成的四聚体成的四聚体,首先与组成核小体的DNA中段120120bpbp相结合相结合,随后,两个第八十张,PPT共一百一十五页,创作于2022年6月H2A、H2B组蛋白二聚体分别与其上下级的DNA结合,形成完整的核小体核心形成完整的核小体核心,146bp长的DNA以左手方式环绕组蛋白八聚体1.8圈,DNA在核心两端各延伸10bp。1分子组蛋白H1与核小体结合,使进出核小体核心两端的DNA区
50、域紧密靠拢而稳定。由于H1的存在,DNA达到166bp,相当于绕组蛋白八聚体两圈。核小体核心颗粒加上一个H1分子构成染色小体第八十一张,PPT共一百一十五页,创作于2022年6月(chromatosome)。两个核小体之间为DNA连接区,平均长度为55bp(在不同的种或不同的组织中其长度会在0100bp范围内变化)称DNA连丝,然后再盘绕另一个组蛋白八聚体核心,如此而不断重复。核小体作为基本结构单位重复连结起来形成核小体作为基本结构单位重复连结起来形成直径直径1010nmnm串联排列的串联排列的“念珠念珠”(beads on a beads on a stringstring),),这是染色体