《染色质、染色体、基因和基因组(2)复习进程.ppt》由会员分享,可在线阅读,更多相关《染色质、染色体、基因和基因组(2)复习进程.ppt(297页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、染色质、染色体、基因和染色质、染色体、基因和基因组基因组(2)(2)第2章 染色质、染色体、基因和基因组 本章内容本章内容 第一节第一节 染色体和染色质染色体和染色质第二节第二节 基因基因第三节第三节 基因组基因组第2章 染色质、染色体、基因和基因组 一、染色体和染色质的形态二、染色质和染色体的化学成分及组成三、染色质和染色体的功能第一节第一节 染色体和染色质染色体和染色质第2章 染色质、染色体、基因和基因组 一、染色体和染色质的形态一、染色体和染色质的形态染色体和染色质其实是同一种物质的两种形态。1882年由Flemming首先提出染色质这一概念。“染色体染色体”用光学显微镜就可以清楚的观察
2、到。在细胞不进行细胞分裂的时候,染色体呈现出松散堆积的形态,无法使用光学显微镜从细胞核中分辨出来,这时的染色体称为“染色质染色质”。后来发现,原来细胞的遗传信息就储存在染色质上,所以是细胞内最为重要的东西。第2章 染色质、染色体、基因和基因组 染色体的形态染色体的形态第2章 染色质、染色体、基因和基因组 染色体,黄色为中心粒第2章 染色质、染色体、基因和基因组 真核生物染色体数目真核生物染色体数目第2章 染色质、染色体、基因和基因组 染色质有两种不同的形态:常染色质常染色质和异染色质异染色质 常染色质常染色质是属于松展状态的染色质,其中的DNA在一定的条件下可以进行活跃的复制和转录,使用染料染
3、色时着色较浅,又可以称为功能性染色质功能性染色质。异染色质异染色质与染料染色较深,其中的DNA处于不活跃不转录状态,呈高度卷曲紧缩状态,又称为非功能性染色质非功能性染色质。第2章 染色质、染色体、基因和基因组 颜色深的部分为异染颜色深的部分为异染色质部分,颜色浅的色质部分,颜色浅的为常染色质部分为常染色质部分第2章 染色质、染色体、基因和基因组 有的染色质为永久性染色质,称为组组成性染色质成性染色质。雌性哺乳动物细胞中两条X染色体中的一条可以转变为异染异染色质色质,其中只有非常少的基因表达。X和和Y染色体染色体第2章 染色质、染色体、基因和基因组(一一)染色质的结构染色质的结构使用一种特殊的技
4、术,将染色体中的DNA全部慢慢释放出来。第2章 染色质、染色体、基因和基因组 组蛋白除去之后的染色体只由DNA和蛋白支架组成第2章 染色质、染色体、基因和基因组 至今为止,我们人类对染色体的结构还没有达到至今为止,我们人类对染色体的结构还没有达到完全的了解,染色体组装的许多细节还不清楚完全的了解,染色体组装的许多细节还不清楚染色质是由DNA、RNA、组组蛋白蛋白和非非组组蛋白蛋白等组成的高度有序的复合物。由于呈纤维状,又叫染色染色质丝质丝,其基本组成单位是核小体核小体。第2章 染色质、染色体、基因和基因组(1)核小体)核小体(nucleosome)1974年 Olins 和Wood Cock等
5、观察到真核细胞间期染色质经过温和处理,可以看到呈串念珠状的结构。每一个小颗粒叫做“核小体”。使用核酸酶可以将核小体分开。核小体是染色质的基本结构单位基本结构单位 第2章 染色质、染色体、基因和基因组 电子显微镜照片电子显微镜照片-串念珠状的结构的串念珠状的结构的染色质染色质 第2章 染色质、染色体、基因和基因组 电子显微镜照电子显微镜照片片-串念珠串念珠状的结构的染状的结构的染色质色质 第2章 染色质、染色体、基因和基因组 第2章 染色质、染色体、基因和基因组 核小体的结构核小体的结构中心是由中心是由8个蛋白质分个蛋白质分子构成的核心结构子构成的核心结构(八聚体),(八聚体),DNA就就缠绕在
6、蛋白质外面。缠绕在蛋白质外面。缠绕在外面的缠绕在外面的DNA分分子的长度是子的长度是146 bp,缠绕将近缠绕将近2圈(圈(1.75圈)圈)。第2章 染色质、染色体、基因和基因组 第2章 染色质、染色体、基因和基因组 蛋白质分子叫做组蛋白,8个蛋白质分子可以分成4种,分别叫H2A、H2B、H3 和H4,各有2个分子。8个组蛋白分子排成2层。每层有4个组蛋白分子,各由一种组蛋白分子构成。第2章 染色质、染色体、基因和基因组 在每一个核小体的外面还有一个组蛋白H1,与缠绕在核小体上DNA的两端结合,起到封闭DNA的作用。第2章 染色质、染色体、基因和基因组 在核小体之间还有一段DNA分子,长度在不
7、同的物种有所差异。酵母中长度为18 bp,是已知最短的连接DNA;人类大约为60 bp。人的连接DNA加上核小体外面缠绕的DNA长度一共大约为200 bp。第2章 染色质、染色体、基因和基因组 每个核小体单位核小体单位包括200 bp左右的DNA,其中大约146 bp缠绕在组蛋白八聚体上面,其余的是位于相邻的核小体之间的连接连接DNA;此外,在DNA分子的外面还有一个组蛋白分子H1,起到封闭DNA两端的作用。核小体外形呈念珠状。直径11 nm左右核小体核心颗粒核小体核心颗粒仅指组蛋白八聚体与外面缠绕的DNA所构成的单位,不包括H1和连接DNA。第2章 染色质、染色体、基因和基因组(2)螺线体(
8、管)螺线体(管)是在核小体结构的基础上进一步紧缩而成的一种结构。主要依靠组蛋组蛋白白H1的相互作用的相互作用将核小体之间连接起来,形成直径为30 nm左右的螺线体(管)结构。这是在电镜下最常看到的结构,呈纤维状。第2章 染色质、染色体、基因和基因组 第2章 染色质、染色体、基因和基因组 螺线体的横切螺线体的横切面图,面图,一般每一圈有6个核小体,呈左手螺旋。第2章 染色质、染色体、基因和基因组 显微镜下常见的染色体结构就是由螺显微镜下常见的染色体结构就是由螺线体组成的直径线体组成的直径30nm结构结构第2章 染色质、染色体、基因和基因组(3)超螺线体()超螺线体(super solenoid)
9、直径30 nm的螺线体进一步螺旋形成直径为400 nm的圆桶状结构,叫做超螺超螺线体线体。这种超螺线体再进一步螺旋化并盘绕、压缩。就形成中期染色体的形态。中期染色体中期染色体第2章 染色质、染色体、基因和基因组 30nm 纤丝纤丝核基质核基质30nm纤丝组成染色体环的结构示意图纤丝组成染色体环的结构示意图第2章 染色质、染色体、基因和基因组 第2章 染色质、染色体、基因和基因组 在这个过程中,DNA分子被高度压缩,最后的压缩比大约有8400倍,甚至更多。可将染色质分为几个层次的结构:可将染色质分为几个层次的结构:一级结构:核小体结构,直径一级结构:核小体结构,直径11nm二级结构:螺线体(管)
10、结构,直径二级结构:螺线体(管)结构,直径30nm三级结构:超螺线体结构,直径三级结构:超螺线体结构,直径200-400nm四级结构:细胞中期染色体单体结构四级结构:细胞中期染色体单体结构第2章 染色质、染色体、基因和基因组 一级结构:核小体结构,一级结构:核小体结构,二级结构:螺线体(管)结构二级结构:螺线体(管)结构三级结构:超螺线体结构三级结构:超螺线体结构四级结构:细胞中期染色体单四级结构:细胞中期染色体单体结构体结构第2章 染色质、染色体、基因和基因组 大肠杆菌的染色体结构大肠杆菌的染色体结构第2章 染色质、染色体、基因和基因组 染色体的组成结构染色体的组成结构第2章 染色质、染色体
11、、基因和基因组 动画:染色体的动画:染色体的结构结构和和组装组装*染色质和染色体染色质和染色体第2章 染色质、染色体、基因和基因组(二二)中期染色质的形态结构中期染色质的形态结构细胞分裂到中期时,染色体紧缩成在光镜下清晰可见的染色体,这时染色质的拧缩到达顶点,轮廓最为清楚,最有利于观察分析。一般可以看到以下的结构:染色单体、着丝粒(主缢痕)、副缢染色单体、着丝粒(主缢痕)、副缢痕、核仁组织区、随体、端粒等。痕、核仁组织区、随体、端粒等。第2章 染色质、染色体、基因和基因组 中期染色体形态中期染色体形态第2章 染色质、染色体、基因和基因组(1)染色单体染色单体:中期染色体由两条染色单体组成,在着
12、丝粒处连接。(2)着丝粒(主缢痕)着丝粒(主缢痕):细胞有丝分裂时纺锤丝附着的部位(3)副缢痕副缢痕:着丝粒以外的缢痕,每种生物的染色体组中至少有一条或一对染色体上有副缢痕。有的副缢痕可以形成核仁组织区。第2章 染色质、染色体、基因和基因组(4)核仁组织区核仁组织区:在染色体的一端的缢痕,叫核核仁组织区仁组织区,此处进行rRNA的合成,与核仁的形成有关,故名。有核仁组织区的染色体叫做核仁组织染色体核仁组织染色体。(5)随体随体:染色体末端部分的球形或圆柱形的片段结构,通过副副缢痕与染色体的主要部分相连。是识别染色体的重要特征之一。又有中间随体和端随体之分。(6)端粒端粒:染色体末端的特化部分,
13、由端粒DNA和端粒蛋白组成,可以维持染色体的稳定。第2章 染色质、染色体、基因和基因组 染色体DNA的关键序列:酵母人工染色体 (Yeast Artificial Chromosome)细菌人工染色体 (Bacteria Artificial Chromosome)(1)自主复制序列(2)着丝粒DNA序列(3)端粒DNA序列第2章 染色质、染色体、基因和基因组(三三)染色体末端的端粒和端粒酶染色体末端的端粒和端粒酶线性染色体的末端不是开放松散的形态,而是有一种特殊的结构,称为端粒(telomere),它(1)保持染色体末端结构的完整,防止染色体末端的降解、融合和缺失;(2)稳定和保护染色体的完
14、整性,保证遗传信息的完整性;(3)指导染色体和核膜连接;(4)端粒的长度反应细胞的分裂能力。第2章 染色质、染色体、基因和基因组 端粒的组成端粒的组成端粒端粒实际上是一个复合体,由端粒端粒DNA和端粒结合蛋白端粒结合蛋白组成。端粒端粒DNA是富含G的重复序列,如脊椎动物的端粒DNA序列是(TTAGGG)n。端粒结合蛋白端粒结合蛋白提供帽子状结构以稳定端粒。第2章 染色质、染色体、基因和基因组 因为DNA聚合酶的特点所致,线性染色体在复制时末端总是有一段DNA无法复制,导致新的染色体长度有所缩短。端粒长度的维持有2条途径,通过端粒酶或非端粒酶途径。第2章 染色质、染色体、基因和基因组 端粒酶端粒
15、酶由RNA和蛋白质蛋白质组成,其中的RNA是合成端粒RNA 的模板,具有催化功能催化功能(核酶)。而其中的蛋白质蛋白质亚基可能具有反转录酶反转录酶的功能。所以端粒酶被认为是一个具有RNA模板的反转录酶。第2章 染色质、染色体、基因和基因组 端粒酶与染色体结构的完整性有关,在正常情况下,体细胞中端粒酶的活性较低,生殖细胞中端粒酶的活性较高;而在一些恶性肿瘤细胞中也发现具有较高的端粒酶活性,有人就将肿瘤细胞中的端粒酶作为抑制肿瘤生长的药物靶点。第2章 染色质、染色体、基因和基因组 二、染色质和染色体的化学成分及组成二、染色质和染色体的化学成分及组成染色质由DNA、RNA、组蛋白组蛋白和非非组蛋白组
16、蛋白等组成。第2章 染色质、染色体、基因和基因组(一)(一)DNADNA是染色体的最重要和最主要的成分。染色体中的DNA根据其复性动力学研究,可以分为以下几种类型:1 非重复序列(单一序列):非重复序列(单一序列):2 轻度重复序列轻度重复序列 3 中等重复序列中等重复序列 4 高度重复序列高度重复序列 第2章 染色质、染色体、基因和基因组 在基因组中只有一个或少数几个拷贝,占基因组总量的40%-80%。例如牛细胞中占55%,小鼠中占70%,果蝇中占79%。1 非重复序列(单一序列)非重复序列(单一序列)一般来说,原核生物的染色体中,这种非重复序列(单一序列)所占比例较真核生物大。大肠杆菌中几
17、乎所有的基因都是单一序列。一般结构基因大多属于单一序列的基因。第2章 染色质、染色体、基因和基因组 一个基因组中含有少数低于10个拷贝的基因序列。但是这些重复序列并不是完全相同的重复,他们之间总有一些差异。有人将这类基因也归入非重复序列(单一序列)中。2 轻度重复序列轻度重复序列第2章 染色质、染色体、基因和基因组 基因组中有10到几百到几千个拷贝的基因序列。占基因组DNA的10%-40%。如小鼠占20%,果蝇占15%。3 中等重复序列中等重复序列各种rRNA、tRNA基因以及某些结构基因如组蛋白基因属于中等重复序列。第2章 染色质、染色体、基因和基因组 一般认为中等重复序列在基因转录开始或基
18、因转录开始或终止终止、DNA复制复制以及细胞内细胞内hnRNA的后的后处理处理方面等有重要作用,一般不编码蛋白质。中等重复序列平均长度为300 bp左右,重复几百次,称为基因家族基因家族。如人基因组中的Alu基基因家族因家族就是中等重复序列,占整个基因组长度的3%到6%之多。第2章 染色质、染色体、基因和基因组 4 高度重复序列高度重复序列 目前仅在真核生物中发现,占基因组DNA总数的10%-60%,一般是一个短小的序列,由6-100个碱基组成,但是重复几万次或几百万次更多。如基因组中的卫星卫星DNA、微卫星微卫星DNA等均是由一些短小的DNA序列多次重复组成。第2章 染色质、染色体、基因和基
19、因组 实验证明,这些卫星卫星DNA位于染色体位于染色体的着丝粒部分的着丝粒部分,有一部分在染色体的染色体的臂臂上。卫星DNA一般不转录,是异染色质的组成成分,可能与染色体的稳定有关,详细的功能未知。第2章 染色质、染色体、基因和基因组 DNA指指纹纹技技术术(亲亲子子鉴鉴定)定)可以用来鉴定人类之间亲源关系的DNA指纹技术(亲子鉴定)指纹技术(亲子鉴定)就是利用的小卫星DNA的重复序列。因为一些卫星DNA序列的排列中拷贝数是高度可变的,在不同的个体中差异极大,表现出基因的多态性。通过酶切、Southern杂交,可以确定几个不同的卫星DNA排列组中DNA的精确长度,从而鉴别一个个体。第2章 染色
20、质、染色体、基因和基因组(二)组蛋白(二)组蛋白细胞内染色体上的组蛋白含量非常丰富,和DNA等量,比例是1:1。组蛋白共有5类或5个家族,其中H2A、H2B、H3 和H4各2个分子组成核心核小体;H1位于DNA分子的外面,起着“封口”的作用。组蛋白带有大量的正电荷,序列中20%到30%由碱性氨基酸组成,这样可以和DNA分子表面的负电荷结合,对于稳定DNA分子起重要作用。第2章 染色质、染色体、基因和基因组 染色体中的主要组蛋白性质比较染色体中的主要组蛋白性质比较第2章 染色质、染色体、基因和基因组 同一类的组蛋白在不同的物种中非常保守,无组织特异性,例如植物和动物之间的组蛋白差异很小。这说明组
21、蛋白对于染色体结构的重要性。第2章 染色质、染色体、基因和基因组 组蛋白组蛋白H1在某些性质方面与其他的组蛋白有所不同。分子量较大分子量较大,在不同的物种之间的差异差异较其他的组蛋白要大,比其他的组蛋白容易失活。在含量方面H1是其他几类组蛋白含量的一半左右。这些说明H1在染色体中具有特殊的独特的功能。第2章 染色质、染色体、基因和基因组 有一些物种中(鸟类、鱼类和两栖类红细胞)没有H1而有另外一种组蛋白,叫做H5,与染色质紧密结合,与不进行转录的DNA相连。第2章 染色质、染色体、基因和基因组 组蛋白上的一些特定的氨基酸能够进行一些化学修饰化学修饰,例如磷酸化磷酸化(丝氨酸的羟基和组氨酸)、乙
22、酰基化乙酰基化(赖氨酸的的自由氨基)、甲基化甲基化(赖氨酸的的自由氨基和精氨酸、组氨酸等)等。第2章 染色质、染色体、基因和基因组 组蛋白的修饰第2章 染色质、染色体、基因和基因组 组蛋白化学修饰的结果化学修饰的结果就是降低了组蛋白的正电荷数,与组蛋白的功能改变有关。各种组蛋白发生化学修饰的时间不一致,而且发生在细胞周期的某一阶段中,可能与细胞分裂、染色质的浓缩等有关。第2章 染色质、染色体、基因和基因组 DNA一般情况下与组蛋白组成的核小体结合,如果组蛋白发生修饰而导致电荷减少,则DNA与核小体的结合力就会减弱,DNA就会从核小体上释放出来,从而开启基因的转录复制等过程。因此组蛋白的修饰与基
23、因的表达有关第2章 染色质、染色体、基因和基因组(三)非组蛋白(三)非组蛋白染色体上还含有一些非组蛋白蛋白质,含有酸性氨基酸较多,带负电荷,故又称为酸性蛋白质酸性蛋白质,非组蛋白占总蛋白量的60%-70%,大约有20-100种之多,分子量在15000 到180000 之间。非组蛋白的含量很少,每一种仅有1万个分子左右,而每一种组蛋白具有6000 万个分子。第2章 染色质、染色体、基因和基因组 非组蛋白具有组织特异性组织特异性和种属特异种属特异性性,而且含量随着外界环境改变而变化。其中包括酶酶(如RNA聚合酶)以及与结构蛋白结构蛋白如细胞分裂有关的收缩蛋白、骨架蛋白、核孔复合物以及肌动蛋白、肌球
24、蛋白、微管蛋白、原肌蛋白等。第2章 染色质、染色体、基因和基因组 非组蛋白与DNA的结合方式与组蛋白不同,它可以从DNA的大小沟中识别出特定的碱基序列与之结合,故这些非组蛋白又被称为序列特异性DNA结合蛋白。第2章 染色质、染色体、基因和基因组 非组蛋白的功能可能是非组蛋白的功能可能是(1)参与染色体的构建(2)启动基因的复制 (3)调节基因的转录等。第2章 染色质、染色体、基因和基因组 非组蛋白中的氨基酸可以进行磷酸化磷酸化,且磷酸化的程度也非常高。大约平均每100个氨基酸中就有几个磷酸化位点。磷酸化可能与基因表达调控有关。第2章 染色质、染色体、基因和基因组 染色体上的RNA有一些人认为是
25、DNA转录后所形成的mRNA,也有人认为有一些RNA结合在组蛋白上面,对基因的转录表达有调节作用。(四)(四)RNA第2章 染色质、染色体、基因和基因组(五)酶(五)酶其实在染色体上发现的酶并不是染色体的组成成分,而是那些以染色体为底物的酶。如DNA聚合酶、RNA聚合酶以及对DNA进行修复、修饰的酶等等,在分离染色体时被一同提取出来了。第2章 染色质、染色体、基因和基因组 三、染色质和染色体的功能三、染色质和染色体的功能染色质是遗传物质的载体,储存重要的遗传信息。生物的遗传信息从DNA流向RNA,再流向蛋白质,这就是中心法则。第2章 染色质、染色体、基因和基因组 如果染色体发生突变,则细胞的生
26、物学功能会受到影响,甚至死亡。染色体染色体的改变的改变数目数目变化变化结构结构改变改变包括染色体发生片段重排和包括染色体发生片段重排和重组,有缺失、重复、倒位重组,有缺失、重复、倒位和易位等四种。和易位等四种。整数倍变化:整套染色体数目整数倍变化:整套染色体数目发生改变,增加或减少发生改变,增加或减少 非整数倍变化:增加或减少一非整数倍变化:增加或减少一条或几条染色体条或几条染色体第2章 染色质、染色体、基因和基因组 染色体数目的变化举例染色体数目的变化举例 第2章 染色质、染色体、基因和基因组 人的Down氏综合症是21号染色体三体所致。Edward综合症是18号染色体三体。Patau综合症
27、是13号染色体三体。第2章 染色质、染色体、基因和基因组 一些性染色体的非整数倍变化一些性染色体的非整数倍变化 单体X(特纳氏综合症)三体X(XXX综合症)多体X和Y 二体Y(超雄综合症):身材高,有暴力和反社会倾向?许多突变导致胎儿死亡,表现为流产,所以无法存活。第2章 染色质、染色体、基因和基因组 Turner syndrome(XO)第2章 染色质、染色体、基因和基因组 一、基因的生物学定义二、基因的分子生物学定义三、原核生物基因特征四、真核生物基因特征五、细胞器基因六、亚细胞结构基因特征七、基因与顺反子的关系八、癌基因与抑癌基因第二节第二节 基因基因第2章 染色质、染色体、基因和基因组
28、 一、基因的生物学定义一、基因的生物学定义基因最早一词是在1909年为Wilhelm Johansen 采用来描述传递和表达特定的描述传递和表达特定的生物性状的可遗传因子生物性状的可遗传因子,并没有涉及到任何特殊的遗传理论。基因这个词最初的含义中并不包含特殊的遗传物质基础,纯粹是作为一个抽象的名词使用的,因为当时根本不知道“基因”是什么东西。第2章 染色质、染色体、基因和基因组 20世纪前半叶,几个独立的工作导出了基因物理和功能基础的更为精确的概念。1902年Archibald Garrod提出,代谢紊乱中的尿黑酸症尿黑酸症是由于某一种特殊的酶的失活引起的,并且以常染色体隐性遗传常染色体隐性遗
29、传方式传代。Garrod并将这种现象称为“先天性代谢缺陷”。第2章 染色质、染色体、基因和基因组 射线诱导的真菌突变导致特定的生化缺陷才被认识,并提出一个基因一个酶一个基因一个酶的理论。由于Garrod不熟悉孟得尔的遗传,这个发现的重要性一直到30年后George Beadle 和Edward Tatam 发现了用X第2章 染色质、染色体、基因和基因组 1911年 Thomas Hunt Morgan指出基因定位在染色体上并且在物理上相连。1944年Oswald Avery和同事通过实验证明,DNA就是遗传物质,这样便勾勒出基因概念的轮廓,即位于染色体上的一段DNA,它可以编码一个酶。第2章
30、染色质、染色体、基因和基因组 后来,随着分子生物学的发展,人们对基因的概念又有了新的认识。发现有的基因不是编码蛋白质,而是编码功能性的RNA分子;一些基因编码具有不同功能的肽链;在一些病毒中基因还可以是RNA分子;一个基因中的信息可以经过加工而被产生一种以上的产物;第2章 染色质、染色体、基因和基因组 现在已经认识到,一个基因可以影响到生物的多个性状(基因多效性),多个基因可以相互合作而控制同一个性状。因此,现在可以比以前更加精确地从功能和结构方面来定义基因这个概念了,但是这个定义在真核和原核中将有所差异。第2章 染色质、染色体、基因和基因组 现在发现基因的形式远比原来想像的要复杂,如出现了重
31、叠基因、断裂基因、复等位基因以及假基因等多种形式,极大的丰富了基因的内涵,也导致精确给基因下定义是比较困难的了。第2章 染色质、染色体、基因和基因组 重叠基因重叠基因是发现在病毒中的一种基因形式,主要有几种重叠的方式:一个基因全部位于另外一个基因内部;部分基因序列重叠;只有一个核苷酸重叠。第2章 染色质、染色体、基因和基因组 病毒基因组中重叠基因第2章 染色质、染色体、基因和基因组 噬菌体X174具有重叠基因第2章 染色质、染色体、基因和基因组 断裂基因断裂基因(split gene)是真核细胞基因存在的一种常见方式,1977年科学家们发现真核中许多编码蛋白质的基因DNA序列被很多虽转录但不翻
32、译的序列所隔开。这些转录后又被除去的DNA序列称为内含子内含子(intron),而最终参与编码多肽链的DNA序列称为外显外显子子(exon)。第2章 染色质、染色体、基因和基因组 真核细胞的基因大多含有内含子,且数目长度不等,变化很大。另外,一个基因被转录出来后,在随后的加工过程中,会采取不同的剪接方式,而最终形成多种形式的mRNA,翻译成不同的蛋白质分子。在这些对内含子的剪接过程中,一种剪接方式中的内含子可能是另外一种剪接方式中的外显子,所以内含子是相对的。第2章 染色质、染色体、基因和基因组 虽然内含子不参与最后蛋白质分子的编码,但是不是没有任何意义的,对于蛋白质的正确产生还有重大意义;如
33、有的内含子编码内切酶内含子编码内切酶,可以对内含子进行正确的剪切等。第2章 染色质、染色体、基因和基因组 复等位基因复等位基因 一个基因的形式是多种多样的,对于一个二倍体的生物来说,某种基因只能有2种形式(即含有1对等位基因);而从一个生物群体中来看,某种基因座上的所有基因形式的数量是非常大的。在一个群体内,同源染色体的某个相同座位上的等位基因超过2个以上时,就称作复等复等位基因。位基因。第2章 染色质、染色体、基因和基因组 人的血型系统共发现有24种,最常见的是ABO型系统。ABO型系统就是由3种复等位基因控制的,分别称为IA、IB和i控制。第2章 染色质、染色体、基因和基因组 另外,组织相
34、容性抗原组织相容性抗原(MHC)基因基因也是含有多种基因的复等位基因。第2章 染色质、染色体、基因和基因组 1978年科学家发现一些DNA序列与基因序列类似,但是又不完全相同,由于缺少一些序列,导致这些基因不能被转录或转录后无法被翻译,或翻译成没有生理功能的多肽。这样的DNA序列称为假基因假基因。第2章 染色质、染色体、基因和基因组 细胞中存在大量的假基因,有的是由于基因突变产生的,这种假基因含有与正常基因类似的内含子和外显子等结构;第二种是不含有内含子的假基因,可能是加工后的基因RNA被反转录后,又被插到基因组中的某个地方而形成的,这种假基因称为“加工假基因加工假基因”。第2章 染色质、染色
35、体、基因和基因组 二、基因的分子生物学定义二、基因的分子生物学定义随着我们对基因认识的逐步加深,我们发现基因的概念是个动态的,仅使用一句话来给基因下定义是非常困难的。第2章 染色质、染色体、基因和基因组 使用分子生物学的术语给基因下的定义是这样的:基因是遗传的基本单位,基因是遗传的基本单位,是有一定长度的DNA或RNA片段,产物是蛋白质或产物是蛋白质或RNA分子分子。基因不仅包含编码多肽链或RNA的核酸编码序列编码序列(ORF),也包含为保证该编码序列转录所必须的调控序列调控序列。调控序列包含有位于编码区前端的前导区前导区,编码区后端的尾部区尾部区以及插在编码区中间的内含子内含子等。第2章 染
36、色质、染色体、基因和基因组 这个概念也不是终极概念,随着我们对基因认识的再次深入,将来这个概念一定还会改变的。第2章 染色质、染色体、基因和基因组 三、原核生物基因特征三、原核生物基因特征以大肠杆菌为例,说明原核生物基因的特征。以大肠杆菌为例,说明原核生物基因的特征。大肠杆菌的DNA长度为4.6X106 个碱基对,存在于一个单一闭环的DNA分子上,并且存在于一个称为拟核拟核的区域内。在正常细胞生长时,DNA保持复制能力,在生长速率达到最大时,平均每一个细胞中含有基因组的2个以上的拷贝。第2章 染色质、染色体、基因和基因组 大肠杆菌的DNA与RNA、蛋白质结合在一起,形成的复合物也被叫做染色体。
37、染色体。由50-100个环(或结构域)组成,这些环(或结构域)的末端与细胞膜上的蛋白质相连而被固定。第2章 染色质、染色体、基因和基因组 大肠杆菌的染色体呈负超螺旋状态存在,其中的蛋白质与真核染色体中的组蛋白不同,而是另外一种叫做HU的蛋白质,又叫“类类组蛋白组蛋白”,以及一种分子量比较小的碱性二聚体蛋白。这些蛋白质对于细菌DNA的压缩、包装进入拟核以及染色体的稳定非常重要。虽然没有发现类似核小体的结构,但是拟核的结构也是非常复杂的。第2章 染色质、染色体、基因和基因组 质粒是细菌染色体DNA的补充。大肠杆菌的DNA分子包含大约4300个基因,其中许多基因已经被定位。大肠杆菌的全基因组序列已经
38、被测定完毕。绝大部分细菌基因都存在于染色体染色体上,少数存在于一种叫做质粒质粒的小环状DNA分子上。基因组测序表明,在寄生类细菌中基因的数目在5001200个,自由生活的细菌中基因的数目为1500-7500,古细菌中基因数目为1500-2700。第2章 染色质、染色体、基因和基因组 第2章 染色质、染色体、基因和基因组 原核细胞的基因特征:原核细胞的基因特征:1 功能相关的基因一般高度集中,组成操纵子操纵子的形式。同一个操纵子中的基因共同转录成一个多顺反子。第2章 染色质、染色体、基因和基因组 2 编码蛋白质的基因是单拷贝基因。3 RNA基因多是多拷贝基因。4 绝大多数的基因是连续的,结构基因
39、之间少有居间序列。居间序列。细菌中的75%DNA是用来编码基因的,另外的25%是基因间DNA,与染色体的复制、染色体DNA的包装等有关。第2章 染色质、染色体、基因和基因组 5 基因DNA序列中几乎没有或很少内含子6 基因组中重复序列少。7 单个染色体成环状。8 几乎所有的细菌都有染色体外的基因,存在于质粒中,是对染色体基因的补充第2章 染色质、染色体、基因和基因组 1 真核细胞基因转录产物为单顺反子。而原核细胞多为多顺反子。四、真核生物基因的特征四、真核生物基因的特征第2章 染色质、染色体、基因和基因组 2 存在重复序列,重复次数可达百万次以上3 基因组中不编码的区域多于编码区域。4 多数基
40、因含有内含子,是断裂基因,DNA中的内含子在转录后要被除去。5 基因组中有基因家族存在。第2章 染色质、染色体、基因和基因组(1)断裂基因)断裂基因(割裂基因割裂基因,split gene)断裂基因是指基因的编码序列在DNA分子上不是连续的,而是被不编码的序列所隔开,其中编码的序列叫做外显子(exon),不编码的序列叫做内含子(intron)。第2章 染色质、染色体、基因和基因组 1977年10-12月,3个实验室同时报道有断裂基因的存在。他们发现老鼠老鼠的-珠珠蛋白蛋白基因、鸡鸡的卵清蛋白卵清蛋白基因和兔子兔子中的-珠蛋白珠蛋白基因的DNA与与mRNA不一致不一致的情况的情况。第2章 染色质
41、、染色体、基因和基因组 最初是通过电子显微镜观察电子显微镜观察到的,后来通过比较序列比较序列发现。很快,许多实验室宣布也发现断裂基因,证明断裂基因的广泛存在。第2章 染色质、染色体、基因和基因组 第2章 染色质、染色体、基因和基因组 第2章 染色质、染色体、基因和基因组 不仅在编码蛋白质的基因中发现有内含子,在rRNA和tRNA基因中也有。在细细菌和噬菌体菌和噬菌体中也发现有内含子的存在。酵母酵母中基因大部分没有内含子。真真核基因核基因大多数有内含子,有一些基因如组蛋白、干扰素基因等没有内含子。但是真真细细菌菌中没有发现有内含子。第2章 染色质、染色体、基因和基因组 Phillip A.Sha
42、rpUSA Richard J.Roberts UK他们获他们获1993年诺贝尔医学奖年诺贝尔医学奖第2章 染色质、染色体、基因和基因组 内含子在转录后的加工过程中被切除,功能相似的基因含有的内含子的数目和位置也类似。内含子虽然不编码最后的产物,但是如果没有内含子则基因不能正确剪切,所以内含子决不是可有可无的东西,或是没用的东西。第2章 染色质、染色体、基因和基因组 近来发现,内含子和外显子的概念是相对的选择性剪接(选择性剪接(alternative splicing)一个基因的转录产物在不同的发育阶段、分化细胞和生理状态下,通过不同的拼接方式,可以得到不同的mRNA和翻译产物,称为选择性剪接
43、选择性剪接(alternative splicing)。所产生的多个蛋白质称为同源体同源体(isoform)。第2章 染色质、染色体、基因和基因组 如原肌球蛋白原肌球蛋白基因可得到10个不同蛋白质产物。肌钙蛋白肌钙蛋白可产生64个蛋白质同源体。果蝇的性分化果蝇的性分化是由一系列基因产物相互作用的结果,通过关键基因转录物的选择性拼接决定了雄性和雌性的差别。选择性拼接广泛存在,在基因表达的调节控制中起了十分重要的作用。目前发现在真核生物中这种剪接机制广泛存在。目前发现在真核生物中这种剪接机制广泛存在。第2章 染色质、染色体、基因和基因组 选择性剪接选择性剪接第2章 染色质、染色体、基因和基因组(2
44、)基因组中含有许多来源相同、结构相似、基因组中含有许多来源相同、结构相似、功能相关的基因,它们被称为基因家族。功能相关的基因,它们被称为基因家族。一类是编码蛋白质编码蛋白质的基因家族,另一类是编码编码RNA的基因家族。基因家族的各个成员中,有的成簇成簇排列在一起,有的在染色体上分散分散排列。其中有的家族成员已经不能再产生有功能的产物,这样的基因成员叫做“假基因假基因”。第2章 染色质、染色体、基因和基因组 由基因家族和单基因组成的较大的基因家族被称为超基因家族超基因家族(supergene family),在超基因家族中,各个成员之间的结构有不等的同源性,虽然他们起源于共同的祖先基因,但是他们
45、的功能已经发生了较大的改变,各不相同了。第2章 染色质、染色体、基因和基因组 低等生物中的rRNA基因中,28S、18S、5.8S和5S rRNA基因都是串联重复的基因家族。高等真核生物中,28S、18S、5.8S的rRNA基因是串联排在一起成一个转录单位,然后这个转录单位再重复排列成基因簇,每个转录单位之间有间隔区分开。这些真核rRNA基因均重复100次以上。(a)串联重复的基因家族)串联重复的基因家族第2章 染色质、染色体、基因和基因组 同种的tRNA基因也是串联在一起形成一个基因簇,每个基因之间有非转录区隔开,有的基因有内含子第2章 染色质、染色体、基因和基因组 串联重复的组蛋白基因家族
46、串联重复的组蛋白基因家族第2章 染色质、染色体、基因和基因组(b)分散重复的基因家族)分散重复的基因家族珠蛋白基因由2个基因家族构成,和类,分布在不同的染色体上。人类的类基因类基因簇簇分布在第16号染色体上,由5个基因组成基因簇,基因簇总长度24 kb;类基因类基因在第11号染色体上,由5个有功能的基因和一个假基因组成基因簇,基因簇总长度60 kb。第2章 染色质、染色体、基因和基因组 人的生长激素基因家族生长激素基因家族有3种:人胎人胎盘促乳素、人生长激素盘促乳素、人生长激素和催乳素催乳素,其中人胎盘促乳素、人生长激素排列在第17号染色体上,催乳素基因位于第6号染色体上。第2章 染色质、染色
47、体、基因和基因组(3)基因组中有大量的重复序列基因组中有大量的重复序列 a 非重复序列(单一序列):非重复序列(单一序列):b 轻度重复序列轻度重复序列 c 中等重复序列中等重复序列 d 高度重复序列高度重复序列 根据序列重复的次数不同,重复序列可以分为几种:第2章 染色质、染色体、基因和基因组 a 非重复序列(单一序列):非重复序列(单一序列):基因在基因组中只有一个或几个拷贝,真核细胞中占40%-70%。真核细胞的大多数基因是单拷贝的,但是单一序列中只有百分之几的序列是编码基因的。而原核基因组中,大多数的单一序列是编码基因的。第2章 染色质、染色体、基因和基因组 b 轻度重复序列轻度重复序
48、列 基因在整个基因组中的拷贝数在2-10之间,有的人将其归入单拷贝序列中。如酵母的tRNA基因、人和小鼠的珠蛋白基因等。第2章 染色质、染色体、基因和基因组 c 中等重复序列中等重复序列 是指长度在300 bp左右在基因组中约有10到几千个拷贝的序列,例如rRNA和tRNA基因。第2章 染色质、染色体、基因和基因组 有2个概念用来描述这种中等重复序列的:基因簇基因簇:是指一组相同或相关的基因排列在一起而形成的结构。基因家族基因家族:是指由一个祖先基因经过重复和变异所产生的一组同源基因。第2章 染色质、染色体、基因和基因组 不同的基因家族中成员的数目不等,功能也各异。基因家族的成员有的位于同一条
49、染色体上,串联在一起,而有的分散在不同的染色体上。如果有的成员因为变异而失去了原有的功能,或不能再进行表达形成有功能的产物,则称为假基因假基因。第2章 染色质、染色体、基因和基因组 人类的人类的Alu家族家族 小鼠的小鼠的B序列序列在人基因组中Alu基因家族基因家族是一个中等重复序列,长度在300bp左右,单倍体基因组中有30万份,分散在各染色体上。在170 bp处有一个限制性酶切位点Alu。基因组中平均每5 kb出现一次Alu序列,因此在基因的内含子以及基因附近的序列中有许多。第2章 染色质、染色体、基因和基因组 Alu家族的每一个成员都很相似,由130 bp的串联重复组成,常见的是二聚体形
50、式,在右半部分的中部有一个31 bp的无关序列插在中间。这个插入序列(IS)来自7SL(是信号识别蛋白SRP的一个成分)。31 bp IS 第2章 染色质、染色体、基因和基因组 Alu家族的广泛存在说明其可能具有某种功能,但是目前还不十分了解。第2章 染色质、染色体、基因和基因组 在小鼠体中有一种和Alu序列同源的序列叫做B1家族,约有5万个成员。重复单位为130 bp,相当于Alu序列的一个单体,和Alu序列的同源性为70%-80%。第2章 染色质、染色体、基因和基因组 Kpn家族家族是中度重复顺序中仅次于Alu家族的第二大家族。用限制性内切酶Kpn消化人类及其它灵长类动物的DNA,在电泳谱