分子生物学-第二章-基因与基因组-新ppt课件.ppt

上传人:飞****2 文档编号:33637330 上传时间:2022-08-12 格式:PPT 页数:277 大小:2.14MB
返回 下载 相关 举报
分子生物学-第二章-基因与基因组-新ppt课件.ppt_第1页
第1页 / 共277页
分子生物学-第二章-基因与基因组-新ppt课件.ppt_第2页
第2页 / 共277页
点击查看更多>>
资源描述

《分子生物学-第二章-基因与基因组-新ppt课件.ppt》由会员分享,可在线阅读,更多相关《分子生物学-第二章-基因与基因组-新ppt课件.ppt(277页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、 第二章 基因与基因组第一节 基因与基因组的概念 一一 基因概念的发展基因概念的发展 从遗传学史的角度看,基因概念的发展大致分以下几个阶段:孟德尔的遗传因子阶段,摩尔根的基因阶段,顺反子阶段,操纵子阶段和现代基因阶段。 (一)孟德尔的遗传因子(一)孟德尔的遗传因子 1865年,奥地利的孟德尔在植物杂交试验的论文中提出生物体的各种特定性状受遗传因子所控制,一个因子决定一种性状。 作为基因雏形名词的遗传因子,只是一种逻辑推理概念,没有任何物质内容。 (二)摩尔根的基因概念(二)摩尔根的基因概念 染色体遗传学之父摩尔根和他的学生们通过果蝇研究把基因定位在染色体上,首先使基因物质化了。 1953年沃森

2、-克里克DNA双螺旋结构模型的提出,这个模型表明基因实际上就是DNA分子的一段核苷酸序列。 20世纪40年代末至50年代初,基因是通知控制特定蛋白质合成来控制代谢,进而决定生物性状的原理变得清晰起来。 (三)(三) 顺反子顺反子 1957年,法国遗传学家本兹尔的噬菌体重组试验结果表明: 基因可被分为更小的单位; 一个顺反子就相当于一个基因,它是一个功能单位,决定一个酶或一条多肽链的表达。 (四)操纵子及其基因(四)操纵子及其基因 1961年,法国分子生物学家雅各布和莫诺基于细菌酶诱导的研究,提出了关于原核生物基因表达调控的“乳糖操纵子模型”。 作为原核生物基因表达调控单元的操纵子,其基因根据功

3、能可分为结构基团、调节基团(?)和控制基团(包括启动基因和操纵基团)三类。(五五) 现代基因概念的扩展现代基因概念的扩展 1. 重叠基因 重叠基因即一个基因包含或部分包含另一基因。 重叠基因的发现揭示了遗传物质的一种经济而巧妙的编排密码子共用核苷酸序列,通过不同的三联体密码子读框编码不同的多肽链。 2. 断裂基因 出现在成熟的mRNA上的DNA序列是不连续的,它们被一些间隔区DNA序列所分隔。 这些间隔区序列在RNA的转录后的加工成熟过程中被切除。 这种基因内部的间隔区DNA序列称为内含子, 出现在成熟RNA中的各个DNA区段称为外显子。 由若干个外显子和内含子互相间隔而组成的嵌和体称为断裂基

4、团。 3. 跳跃基因 跳跃基团又称为转座元件,它是指那些可从染色体的一个位置跳到另一个位置,或从一条染色体跳到另外一条染色体上的可移动遗传元件。 4. 假基因 假基因也称“拟基因”,是一类没有功能的特殊基团。 假基因的核苷酸序列与其相应的有功能基因基本相同,原来也可能是有功能的基因,由于缺失或点突变等原因失去活性,成为无功能基因。 二 . 基因的概念 (一) 基因的概念 基因(gene)是生物体传递和表达遗传信息的基本单位。 从化学角度观察,基因则是一段具有特定功能和结构的连续的脱氧核糖核酸序列,是构成巨大遗传单位染色体的重要组成部分。 指表达一种或多种蛋白质或功能指表达一种或多种蛋白质或功能

5、RNARNA的遗传物的遗传物质的基本单位。质的基本单位。 一段制造功能产物的完整的染色体片段(一段制造功能产物的完整的染色体片段(a complete chromosomal segment responsible for making a functional product.*)。包含基因的产物、基因的功能包含基因的产物、基因的功能性及性及完整性完整性(包括一个蛋白质或(包括一个蛋白质或RNA的全部的全部编码序列编码序列和编码区之外对编码区转录功能所必要的非编码的和编码区之外对编码区转录功能所必要的非编码的调调控区控区。)。)基因的分子生物学定义基因的分子生物学定义 一个基因不仅是编码有功

6、能的蛋白质多肽链或RNA所必需的核酸序列(通常指DNA序列),而且还包括为保证转录所必需的调控序列、5端非翻译序列、内含子以及3非翻译序列等核酸序列。根据基因是否具有表达功能可以将其分为三类 第一类是编码蛋白质的基因,它具有转录和翻译功能,包括编码酶、其他功能蛋白和结构蛋白的结构基因以及编码阻遏蛋白的调节基团。 第二类是只有转录功能而没有翻译功能的基团,包括tRNA基因和rRNA基因。 第三类是不转录的基因,它对基因表达起调节控制作用,包括启动基因和操纵基因,这类基因也称控制基因。( (二二) ) 基因的命名法基因的命名法 目前对基因的命名一般根据种属习惯,方法并未统一。 基因的命名一般用斜体

7、字,按种属字母和数学符号来表示。 如果表示蛋白产物和表型,就用大写字母。 如果表示隐性突变,用小写字母。表示显性突变,第一个字母要大写。 在其它一些种属包括人的基因命名中,基因全由大写字母表示。大肠杆菌和其他细菌 三个小写字母表示一个操纵子,接着的大写字母表示不同基因座。 例如:lac操纵子;基因座:lacZ,lacY,lacA。 蛋白质:LacZ,LacY,LacA。 另外还采用特殊惯例命名B.subilis的孢子发生基因。 这些基因以spo后加上表示孢子发生的形态阶段的罗马数字表示,再用大写字母表示表示操纵子,而后为基因座, 例如,spoGA就表示在第二阶段表达的操纵子G的第一个基因座。

8、酵母 三个字母表明基因功能,而后的数字表示不同的基因座。 啤酒酵母基因GAL4,CDC28; 蛋白质:GAL4,CDC28。 非洲蜀酒酵母基因gal4,cdc2; 蛋白质:Gal4,Cdc2。 线虫 用三个小写字母表示突变表型,如存在不只一个基因座,用连字符号接数字表示, 例如,基因unc-86,ced-9;蛋白UNC-86;CED-9。 果蝇 来自突变表型的描述可以用1-4个字母表示。 例 如 , 基 因w h i t e ( w ),tailless(tll),hedgehog(hh);而蛋白为White,Tailless,Hedgehog。 植物 虽然没有适用于所有植物的惯用法,但大多数

9、用1-3个小写字母表示。 Arabidopsis基因用果蝇的方法命名,但 使 用 大 写 字 母 , 例 如 , 基 因AGAMOUS(AG),蛋白AGAMOUS。 脊椎动物 一般以描述基因功能的1-4个小写字母和数字表示其基因功能。 例如,基因sey,myc,蛋白Sey,Myc。 人类 方法如脊椎动物但需大写。例如基因MYC、ENO1。二. 基因组的概念 基因组(genome)是细胞或生物体的全套遗传物质。 The genome is the complete set of sequences in the genetic material of an organism. It includ

10、es the sequence of each chromosome plus any DNA in organelles. 是一种生物染色体内全部遗传物质的总和,包括构成基因和基因之间区域的所有DNA。 就细菌和噬菌体而言,它们的基因组是指单个染色体上所含的全部基因; 而二倍体真核生物的基因组则是指维持配子或配子体正常功能的最基本的一套染色体及其所携带的全部基因。(即由一个物种的单倍体的染色体构成。由一个物种的单倍体的染色体构成。/任一任一 生物染色体的单个单倍体组。生物染色体的单个单倍体组。) 基因组基因组在个体水平代表一个个体所有遗传性状的总和,在细胞水平代表一个细胞所有不同染色体(单倍

11、体)的总和,在分子水平代表一个物种所有DNA分子的总和。 简而言之,它表示一种生物的DNA或RNA所含的全部遗传信息。 基因组与基因,一般以DNA的长度和序列来表示。 生物的复杂性与基因组内的基因数量有关,进化程度越高,基因组越复杂。 第二节 病毒(噬菌体) 基因组 病毒病毒(virus)是一类没有细胞结构但有遗传、变异、共生和干扰等生命现象的微生物。 在结构上,没有细胞结构,因此称为病毒颗粒而非病毒细胞; 在化学组成上,完整的病毒颗粒通常由一种或几种蛋白质和一种核酸组成,有些种类还含有一定量的脂类物质和碳水化合物,而类病毒仅仅以核酸形式存在; 在生命活动上,这种最简单的生命形式需借助其他生物

12、细胞完成其生命过程,基因组信息的遗传与变异是其生命活动的最主要内容。一. 病毒基因组核酸的主要类型 病毒(virus)是最简单的生物,外壳蛋白包裹着里面的遗传物质核酸。 1、双链DNA 多数动物病毒,如腺病毒、疱疹病毒、痘病毒,环形、线形。2、单链DNA 动物病毒中仅微小病毒为单链病毒;噬菌体中仅含单链DNA。 RNA病毒基因组所携带的遗传信息一般在同一条链上,序列与mRNA相同的为正股(+),与mRNA互补的为负股()3、双链RNA 以负链RNA为模板转录出mRNA如呼肠孤病毒及噬真菌体。4、单链负股RNA 5、单链正股RNA: 如逆转录病毒二. 病毒基因组结构与功能1、不同病毒的基因组的大

13、小差异很大。 比细菌基因组小,只能编码少数蛋白,遗传信息量较小。 2、不同病毒的基因组可以是不同结构的核酸; 每种病毒基因组由DNA或RNA中的一种组成。 核酸的结构可以是单链或双链,闭合环状或线状分子。 根据基因组的核酸类型,病毒可分为DNA病毒和RNA病毒。3、病毒基因组有连续的也有不连续的; 噬菌体的基因是连续的。而多数真核细胞的病毒常含有不连续基因。 除正链RNA病毒外,真核细胞病毒的基因先转录成mRNA前体,再加工为成熟的mRNA。故病毒基因的特性更像真核生物基因。 4、病毒基因组的编码序列大于90%; 大部分序列用来编码蛋白,基因之间的间隔序列(spacer sequence)非常

14、短。 如X174的非编码区只占217/ 5386.5、一般属单倍体基因组 ;7、功能上相关的基因往往集中成簇,在基因组的特定部位构成一个功能单位或转录单元。 转录产物往往是多顺反子的RNA,然后加工成各蛋白质的mRNA。8、病毒的DNA复制及基因表达往往依赖于宿主细胞的系统。 根据宿主不同,病毒又可分为动物病毒、植物病毒和噬菌体。9、常有基因重叠现象. 一个基因可以完全在另一基因内,或者部分重叠,甚至两个基因之间只有一个核苷酸重叠。 重叠基因可能使用共同的核苷酸序列,但转录成的mRNA有不同的阅读框架(open reading frame,ORF) ,产生的蛋白质分子大不相同。 有些重叠基因会

15、使用相同的阅读框架,但起始或终止密码子不同。 基因重叠时,共同序列上发生的突变可能影响一个基因甚至两个基因的功能。 重叠基因现象反映了原核生物利用有限遗传资源表达更多生物功能的能力。 真核生物基因组中极少重叠基因现象。 例如, 174DNA全部5386个核苷酸序列的11个基因中,除了基因B完全在基因A内,基因D和E部分重叠外,特别有趣的是蛋白D的终止密码子最后一个核苷酸是蛋白J起始密码子的第一个核苷酸。 剑桥的分子生物学家D.C.Show和J.E.Walker等,在测定G4噬菌体DNA的核苷酸序列时,又发现了一种三重重叠基因。 图图3-6 174噬菌体噬菌体DNA中基因中基因D和和E(以及相应

16、的编码以及相应的编码蛋白质)的起点与终点蛋白质)的起点与终点 第三节 原核生物基因组 一. 染色体基因组 原核生物原核生物是一些由无细胞核的细胞组成的单细胞或多细胞的低等生物,主要包括细菌、支原体和植物中的蓝藻门。 原核生物无真正的细胞核,无核膜,遗传物质存在于整个细胞中。 DNA有时相对集中,以裸露的形式存在。 可与蛋白质结合,但不构成染色体结构,此结构又叫类核体,习惯上仍将其基因组DNA与支架蛋白组成的结构称为染色体,有时也将其核酸分子称做原核生物染色体。 原核生物基因组都很小,如大肠杆菌,整个基因组由4.6(也有说4.2的)106bp组成,相对分子质量为2.4109,大约包括300040

17、00个基因。 所有原核生物的遗传物质均为DNA。 与病毒相比,原核生物有较完整的代谢系统,进行较复杂的代谢活动,如从外界环境摄取营养物质、对外界环境的改变做出反应等。故原核生物基因组结构基因的数量和功能远多于病毒基因组。 二. 染色体基因组的特点1. 常仅由一条环状双链DNA分子组成 细菌染色体的环化性使得在缺少端粒(telomere)的情况下,仍能够完整的复制。 这条环状双链DNA分子在细胞内形成一个较为致密的区域,称为类核。 类核无核膜与胞浆分开,其中央部分由RNA和支架蛋白组成,外围是呈超螺旋状的双链闭环染色体DNA。 但现在也发现有线形基因组。2. 只有一个复制起始点,一个复制起点 。

18、3. 具有操纵子(operon)结构。 DNA序列中功能相关的RNA或蛋白质基因往往前后排列在一起形成一个转录单位,从同一启动子开始转录形成一个多顺反子mRNA,再被分别表达成不同的RNA或蛋白质。4. 基因组的序列绝大部分是用来编码蛋白质的,只有极少部分不转录,而不转录部分通常是控制基因表达的序列。 越是简单的生物,其已知 基因数越接近于从其DNA分子量所估计的基因数。 5. 基因是连续的,无内含子,转录后不需剪接。6. 编码区在基因组中所占比例远远大于真核基因组,小于病毒基因组小于病毒基因组。 编码蛋白质的结构基因是单拷贝的,而rRNA基因往往是多拷贝的。7. 存在着少量基因重叠的现象。

19、编码顺序一般不会重叠。8、基因组中重复序列很少,一般为单拷贝,如结构基因。 但编码rRNA的基因往往是多拷贝。9、具有编码同工酶的基因(isogene).10、细菌基因组中存在可移动的细菌基因组中存在可移动的DNA序列,序列,包括插入序列和转座子。包括插入序列和转座子。11、基因组DNA有多种调控区(也有人称之为功能识别区域),如复制起始区、终止区、转录启动子、终止子等特殊序列,还有重复序列,比病毒基因组要复杂。病毒和原核生物基因组总结病毒和原核生物基因组总结病毒基因组病毒基因组细菌基因组细菌基因组基因组较小,编码少数蛋白质基因组较小,编码少数蛋白质基因组基因组 106 bp ;具有单一的复制

20、起点具有单一的复制起点可以为单可以为单/双链、环状双链、环状/线性线性DNA或或RNA;单一片段或多个片段单一片段或多个片段(节段基因组)(节段基因组)环状或线形,均为环状或线形,均为DNA; “类核类核”的主基的主基因组和独立的因组和独立的DNA分子(质粒)分子(质粒)常为常为重叠基因重叠基因存在存在重叠基因重叠基因非编码区占基因组的小部分非编码区占基因组的小部分非编码区占基因组比例很小非编码区占基因组比例很小功能相关基因集中成簇,构成一功能相关基因集中成簇,构成一个功能单元或转录单位个功能单元或转录单位有有操纵子操纵子结构结构连续(噬菌体)连续(噬菌体)/不连续基因不连续基因(真核细胞病毒

21、)(真核细胞病毒)连续,无内含子连续,无内含子大部分序列是单一序列(结构基因和调大部分序列是单一序列(结构基因和调控区);控区);重复序列少重复序列少, 1%, 拷贝数拷贝数 10有可移动的有可移动的DNA序列序列三. 质粒(plasmid)基因组 (一) 质粒的概念 质粒是细菌细胞内携带的染色体外的DNA分子,是共价闭合的环状DNA分子(covalent closed circular DNA cccDNA),大小在1200 kb,能独立进行复制。 它存在于许多细菌以及酵母菌等生物中。 质粒离开宿主细胞则无法复制和扩增,质粒“友好”地借居于宿主细胞内。靠宿主细胞才能完成自己的复制。 而质粒对

22、宿主细胞的生存而言却不是必需的,宿主细胞丢失了质粒依然能够存活。 质粒不是单纯的寄生,所携带的遗传信息能赋予细菌特定的遗传性状。 例如,致育性质粒(F质粒)可以决定细菌的性别; 耐药性质粒(R质粒)带有耐药基因,可以使宿主菌获得耐受相应抗生素的能力; 大肠杆菌素质粒(Col质粒)能使大肠杆菌合成大肠杆菌素,后者可以杀死不含大肠杆菌素质粒的亲缘细菌。(二) 质粒的分类 1.严紧型粒和松弛型粒 根据复制性质,可以把质粒划分为两类: 一是严紧型粒(stringent plasmid),当细胞染色体复制一次时质粒也复制一次,每个细胞只有12个质粒,也称为低拷贝数质粒; 另一类是松弛型粒(relaxed

23、 plasmid),当染色体复制停止后仍继续复制,每一个细胞内一般有20个左右的质粒,也称为高拷贝数质粒。 一般分子量较大的质粒属严紧型,分子量较小的属松弛型。 需要指出,一种质粒属于松弛型还是严紧型并不是绝对的,这往往同宿主的状况有关。 同一质粒在不同的宿主细胞中可能具有不同的复制型,这说明质粒的复制不仅受自身的制约,同时还受到宿主的控制。 2.接合质粒和非接合型质粒 根据质粒DNA中是否含有接合转移基因,可以分成两大类。 接合型质粒(conjugative plasmid)也称自我转移的质粒,这类质粒除含有自我复制的基因外,还带有一整套控制细菌配对和质粒接合转移的基因,因此能从一个细胞自我

24、转移到另的细胞。 如F质粒,部分R质粒和部分Col质粒。 如F质粒,雌雄细胞通过性纤毛相互接触而结合,质粒便从一个细胞传递给另一个细胞。 非接合型质粒也称不能自我转移的质粒。 此类质粒含有自我复制的基因,能进行自我复制,但不含转移基因。 因此,这类质粒不能从一个细胞自我转移到另外的细胞。 3.相容性质粒和不相容性质粒 质粒有相容性和不相容性两种。 相容性质粒可以在同一宿主菌的细胞内同时存在。 但也有些质粒不能相容,不能在同一个宿主菌的细胞内同时存在。 通常亲缘关系密切的两种质粒不能在同一宿主细胞中稳定共存,这一现象称为质粒的不相容性(plasmid incompatibility),也称不亲和

25、性。 4.窄宿主谱质粒和广宿主谱质粒 窄宿主谱质粒存在于一种或数种密切相关的宿主,而广宿主谱质粒可以在不同科,属,种细菌之间传递。 质粒的宿主范围是由质粒复制时对宿主的依赖程度决定的。 5.按功能分类 R质粒:抗药性质粒 F质粒(fertility factor):性质粒(sex plasmid)可决定细菌的性别 Col质粒:大肠杆菌素质粒,合成大肠杆菌素,杀死不含大肠杆菌素质粒的亲缘细菌。质粒质粒DNApBR322EcoR、Pst、Hind、BamH、Sal只有一个酶切位点,便于外源基因的插入。(三) 质粒的遗传控制 1. 复制调控系统:控制质粒的拷贝数。 复制调控系统控制质粒的拷贝数。 该

26、系统由质粒的复制起点(ori)、rep基因和cop基因构成。 Rep基因产物Rep蛋白结合于复制起始位点,启动质粒的复制。 但当Rep蛋白过量时,即可通过抑制自身基因的启动子(promoter)抑制其基因的进一步转录,减少Rep蛋白的生成,从而使质粒的复制保持一定频率。 Cop基因序列及其表达产物对复制起抑制作用,从而控制质粒的拷贝数。 2. 分配系统:使质粒在细菌分裂过程中精确分配到子细胞。 分配系统的作用是使质粒在细菌分裂过程中精确地分配到子细胞中。该系统的缺陷将影响质粒在细胞中的稳定存在,导致质粒丢失频率增高。 3.细胞分裂控制系统:抑制细胞分裂,使细胞分裂与质粒复制相协调。 细胞分裂控

27、制系统能够抑制宿主细胞的分裂,使细胞分裂与质粒复制协调。该系统对低拷贝数质粒的稳定遗传尤其重要。 4.位点特异重组系统。 位点特异重组系统由质粒的附着位点、质粒编码的整合酶、切除酶和宿主提供的辅助因子FIS(factor for inversion stimulation)等组成。其作用是调节高拷贝质粒向子代细胞的平均分配过程。 5.质粒的不相容性。具有相同复制起始位点和分配区的两种质粒不能共存于一个宿主菌。(四) 质粒DNA的提取 1.细菌的培养:可加少量抗生素(如氯霉素)抑制宿主蛋白质的合成,质粒大量扩增。 2.细菌的收集和裂解:离心弃上清 3.质粒DNA的分离纯化第四节真核生物基因组及其

28、特点第四节真核生物基因组及其特点 真核生物的遗传物质主要集中在核膜包围着的细胞核中,DNA和特殊的蛋白质(如组蛋白、非组蛋白 )相结合组装成为染色体。 在真核细胞中每条染色体只含有一个DNA分子。 真核生物的基因组一般比较庞大,例如人的单倍体基因组由3109 bp碱基组成,按1000个碱基编码一种蛋白质计,理论上可有300万个基因。 但实际上,人细胞中所含基因总数大概不会超过4万个。 这就说明在人细胞基因组中有许多DNA序列并不编码蛋白质或RNA。 DNA的复性动力学研究发现这些非编码区往往都是一些大量的重复序列,这些重复序列或集中成簇,或分散在基因之间。 在基因内部也有许多能转录但不翻译的间

29、隔序列(内含子)。 因此,在人细胞的整个基因组当中只有很少一部份(约占2-3)的DNA序列用以编码蛋白质。 从是否编码蛋白质或RNA来看,庞大的真核生物基因组实际上由两大类序列组成: 1.基因和基因相关DNA序列,包括编码的DNA序列和非编码的DNA序列(如内含子、基因片段和假基因等)。 2.基因外DNA序列,包括各种重复序列以及非编码的单拷贝和低拷贝序列。一. 基因组结构与功能的特点 1.含两份同源的基因组 真核生物基因组DNA与蛋白质结合形成染色体,储存于细胞核内,除配子细胞外,体细胞内的基因的基因组是双份的(即双倍体,diploid),即有两份同源的基因组。 2.结构复杂,基因数庞大,基

30、因组远远大于原核生物的基因组,具有许多复制起点。 每个复制子大小不一,每个复制子的长度较小。3.真核基因由一个结构基因与相关的调控区组成,转录产物为单顺反子。 一个结构基因经过转录和翻译生成一个mRNA分子和一条多肽链。4.含有大量重复序列。 真核基因组的非编码序列中含有高度重复的卫星DNA反向重复序列和中度重复的散在重复序列; 编码序列也有含有一些重复的编码蛋白质或RNA的结构基因。 5 .非编码序列(non-coding sequence NCS)占90%以上, 基因组中不编码的区域多于编码区域。 非编码序列的高比例是真核生物与细菌和病毒的重要区别,而且在一定程度上也是生物进化的标尺。 非

31、编码序列包括高度和中度重复序列、内含子、间隔序列等。存在的目的似乎是复制自己,故而有自私DNA之称。 6 .存在断裂基因(split gene),有内含子结构 ,基因与基因间的非编码序列为间隔DNA( spacer DNA).7 .功能相关的基因构成各种基因家族,可串联在一起,也可相距很远。 8. 真核基因组中存在逆转录转座子 真核基因组中存在大量的转座元件。 其中既有结构与原核生物转座子相似,由DNA介导转座过程的DNA转座子; 也有真核基因组特有的逆转录转座子或逆转录元件。 9.真核基因组中存在大量的顺式作用元件 顺式作用元件是指那些与结构基因表达调控相关、能够被基因调控蛋白特异性识别和结

32、合的DNA序列。 真核基因组具有启动子、增强子、沉默子、反应元件和加尾信号等顺式作用元件。 10.真核生物基因组具有端粒结构 端粒是真核生物线性基因组DNA末端的一种特殊结构。 该结构DNA序列相当保守,一般由多个串联在一起的短寡核苷酸序列构成,是一段DNA序列和蛋白质形成的一种复合体。 端粒具有保护线性DNA的完整复制、保护染色体末端和决定细胞的寿命等功能。 11. 真核基因组中存在大量的DNA多态性 DNA多态性是指DNA序列发生中变异而导致的个体间核苷酸序列的差别。 真核基因组的DNA多态性主要包括单核苷酸多态性和串联重复序列多态性两大类。 1) 串联重复序列多态性 卫星DNA这类可变数

33、目串联重复序列由于其重复单位的重复次数变化而形成串联重复序列多态性。 这主要发生于小卫星和微卫星DNA中,人群中频率极高。 2)单核苷酸多态性(SNP) SNP是指在基因组水平上由单个核苷酸的变异引起的DNA序列多态性。 人类基因组中每500-1000个碱基对中就有1个SNP,属于最常见的一种变异。 它越益被认为与人体的表型差异、不同群体和个体对各种药物的耐受性差异、对环境因子的反应差异、对疾病的易感性差异有关。 SNP可导致等位基因间在特定位点上的DNA序列差异,这种现象叫DNA 位点多态性(DNA site polymorphism ) SNP如果发生在限制性内切酶识别位点上,则可导致酶切

34、位点的变化,从而在用限制性内切酶切割DNA时出现长度不等的限制性片段,这种现象称为限制性片段长度多态性(restriction fragment length polymorphism, RFLP)。二二. .真核生物基因组的真核生物基因组的C C值悖理(值悖理( C C值矛盾)值矛盾) 真核生物基因组较原核生物大得多,真核生物基因组来源不同,分子量差别也很大。 与大肠杆菌染色体DNA分子量相比,果蝇染色体DNA分子量差不多是大肠杆菌染色体DNA的300倍。 而人含有比大肠杆菌多600800倍的DNA。 生物体的一个特征是一个物种单倍体基因组的全部DNA含量总是相对稳定的,这个含量即为该物种的

35、C值(C-Value),以pg表示(1pg=10-12g)。 (现在的文献似更倾向于用碱基对bp来表示。) 不同物种的C值差异很大,最小的支原体为106bp,而两栖动物可达1011bp。 每个物种的C值是相对恒定的。 随着生物的进化,生物体的结构和功能越显复杂,其C值就越大,像真菌和高等植物同属于真核生物,但后者的C值大很多。 因为这时所需要的基因产物的种类越多,所需基因也越多。 但从另一方面看,随着进化,生物体的复杂性和DNA含量之间的关系模糊了甚至令人费解。主要表现在如下方面1)C值不(一定就)随生物的进化程度和复杂性(的增加)而增加,如肺鱼的C值为112.2,而人的是3.2,与牛的相近;

36、 昆虫的C值大约是108 bp ,而两栖类动物如两栖鲵(amphiuma)的C值是8.61010 bp在昆虫与两栖类之间,C值相差近千倍; 两栖类的C值竟然比包括人类在内的哺乳类(3109 bp)的C值还高。2)(即使)亲缘关系密切的生物,其C值(也可能)相差甚大,如豌豆为14,而蚕豆为2;3)高等真核生物具有比用于遗传高得多的C值,如人的染色体组DNA含量在理论上包括300万个基因,但有实际用途的基因只有5万10万个左右。 目前,很难令人相信这样的差异与生物复杂性有什么关系。 很难解释牛与人的DNA含量相等,而豌豆与蚕豆DNA含量却相差7倍。 显然,DNA的含量与物种间的差异有一定关系,但与

37、物种间的复杂性并没有严格的对应关系。 这种C值与生物进化复杂性不相对应的现象称为C值悖理(C value paradox)。 这暗示着真核生物基因组中必然存在大量的不编码基因产物的DNA序列。 三三. .DNA复性动力学的应用与真核生物复性动力学的应用与真核生物DNA序列的类型序列的类型 (一)DNA复性的速度能够指明该DNA的单一序列的长度 在DNA复性过程中,由于双螺旋重聚合要求两种游离互补的碱基序列在溶液中发生碰撞,因此复性的速率决定于两者碰撞的概率。 复性动力学方程:C/C0=1/(1+KC0t) 在实验条件恒定时,C/C0(反应t秒后余留的DNA单链的百分数)仅仅决定于C0t,即决定

38、于DNA单链起始浓度与保温(宜为反应)时间的乘积。 当C/C0=1/2时,KC0t=1, 即C0t1/2 =1/k 此时的C0t值以C0t1/2表示,它代表DNA序列的复杂程度。 在变性的DNA样品中,彼此互不相同的核苷酸碱基序列的数目越多,单位时间内,跟另一股互补链可能相遇的概率也就越低,复性速度就越慢; 反之,在变性DNA样品中含有的重复序列数目越多,则互补链相遇的概率就会高,复性速度就越快。 因此,C0t1/2值与复性速度大小成反比,也就是基因组的复杂度与其C0t1/2成正比。 任何DNA的复杂度都可以通过与已知复杂度的标准DNA的C0t1/2作比较来确定。 通常用E.coli DNA作

39、标准,因为它的复杂度同它的基因组DNA长度4.2106 bp相同,两者的关系可以写成:任何DNA的C0t 1/2 /E.coli的C0t 1/2 =任何DNA的复杂度 /4.2106bp (二)(二)真核生物基因组DNA序列的类型序列的类型 根据真核生物基因组DNA的重复频率可把其分为四种序列类型。 真核生物的一个显著特点就是富含重复序列。 这些重复序列的长短不同,短的仅有几个甚至两个核苷酸,长的有几百乃至上千个核苷酸。 重复序列的重复程度也不一样。重复多的可在基因组中出现几十万到几百万次,称为高度重复序列; 重复几十到几千次称中度重复序列; 重复极少的称为轻度重复序列; 不重复的序列则称为单

40、一序列或单拷贝序列。 1单拷贝序列(single copy sequence)或单一序列(单一序列(unique sequenceunique sequence) 真核生物的大多数基因在单倍体中都是单拷贝的,乃(复性曲线中)复性最慢的组分。 单拷贝序列最重要的作用是具有编码功能。 在单倍体基因组里,这些序列包括编码蛋白质和酶的结构基因,其两侧为间隔序列和散在分布的重复序列。 编码蛋白质的单拷贝序列决定生物的各种功能,因此对这些序列的研究具有特别重要的意义。 不重复序列长约7502000 bp,相当于一个结构基因的长度,这类序列的Cot值与基因组中DNA的含量成正比。 真核生物基因组中单拷贝序列

41、约在4070,人类基因组中单拷贝序列约占60%65%。 有学者认为,编码序列只占单拷贝序列的一小部分,所以单拷贝序列除了编码以外似还应有其它功能。2 2轻度重复序列(轻度重复序列(slightly repetitive slightly repetitive sequencesequence) 这种重复序列在基因组中只有210个拷贝,主要是组蛋白和tRNA基因。 轻度重复序列包括两种情况。 一是重复序列中的基因都是有功能的,编码同一蛋白或RNA。 例如血红蛋白链的基因有胚胎型和胎儿型,只是基因产物在氨基酸组成上是各有差异; 二是重复序列中的基因有的有功能,有的没有功能,如假基因等。 轻度重复序

42、列很难用点突变方法进行鉴定,因为任何一个拷贝的失活都不能影响其它拷贝的活性。 3 3中度重复序列(中度重复序列(moderately moderately repetitive sequencerepetitive sequence) 中度重复序列一般都是不编码(蛋白质)的序列,有几十至数千个拷贝(也有学者说是数万到数十万),例如rRNA基因和tRNA基因等。 其复性速度快于单拷贝序列,但慢于高度重复序列。 目前认为,大部分中度重复序列与基因表达的调控有关,它们可能是与DNA复制、转录的起始和终止有关的酶及蛋白质因子的识别位点。 还有学者认为,此类序列可以开关基因的活性,其转录产物参与hnRN

43、A的加工等。 根据重复序列的长度,中度重复序列可分为两种类型。 (1)短周期的分散重复序列(即基础单位短的散在重复序列),每个序列长约100300bp,它们与平均长度均为1000bp的单拷贝序列间隔排列。 有学者说其拷贝数大于10万。 主要在人、爪蟾和海胆等中已有发现,如Alu家族 ; (2)长周期的分散重复序列(即基础单位长的散在重复序列),每个大约5000bp。 长、短周期的中度重复序列的共同特征是两端有类似于转座子两端的重复序列,这种现象十分类似于逆转录病毒的结构。 基因组中有几千种中度重复序列,其中有的构成序列家族。 各家族成员有的重复串联在一起,有的分散,与非重复序列相间排列。 中度

44、重复序列具有较强的种特异性,可作为探针区分不同的哺乳动物细胞的DNA。 4高度重复序列(highly repetitive sequence) 高度重复序列在基因组中所占比例随物种而异,约占10-60%, 大多数高等真核生物的DNA都含有20以上的高度重复序列(在人类基因组中约占20%) 复性速度很快。 由非常短的序列重复多次,可达几百万个拷贝,串联成长长的一大簇。 典型的高度重复序列有卫星DNA和反向重复序列两类。 高度重复序列大部分集中在异染色质区,特别是在着丝粒和端粒附近。 在这些高度重复序列中,常有一些AT含量很高的简单高度重复序列,因为序列简单,缺乏转录必要的启动子而不具转录能力。

45、此类存在于几乎所有高等真核生物的基因组内,其数目变化很大,其功能至今不清,可能与稳定染色体有关 。 例如,果蝇染色体之着丝点附近存在有几种高度重复序列: ACAAACT有1.1X107个拷贝,占基因组DNA的25/100, ATAAACT及ACAAATT各占3.6X106个拷贝,各占基因组DNA8/100。 此区段中,一条链之A或T含量多,导致两条链浮力密度不同,故复性时一条链为重链,一条链为轻链。 三.重复序列的分类 真核生物基因组中的重复序列,根据其在基因组中的分布方式又可分为三类: 一类散在基因组中,称为散在重复序列,如Alu家族; 另一类重复单位呈串联状,首尾相连排列在一起,称为串联重

46、复序列。 卫星、小卫星和微卫星是串联重复序列中最常见的三种类型。 另外还有反向重复序列(一)反向重复序列反向重复序列(inverted repeats) 指两个顺序相同的拷贝在同一DNA链上呈反向排列。有学者认为有2种形式。 一种形式为两个反向排列的拷贝之间隔着一段间隔顺序如: 5AAACCACCGCTGGTAGCGGTGGTTT3 3TTTGGTGGCGACCATCGCCACCAAA5 另一种是两个拷贝反向串联在一起,中间没有间隔序列,这种没有间隔的反向重复序列也称回文结构(palindrome) 。 回文指正读与反读意义都相同的句子。例如,斗鸡山上山鸡斗,龙隐岩中岩隐龙斗鸡山上山鸡斗,龙隐

47、岩中岩隐龙。 对DNA结构来说,即在一个假想轴的两侧,某些碱基序列之间有倒转重复的关系。DNA变性后,倒转重复序列之间可以形成十字结构或发夹结构。 回文结构指 DNA上的倒转重复的序列。回文序列回文序列(palindromic sequence):指):指DNA序列序列中,以某一中心区域为对称轴,其两侧碱基序列中,以某一中心区域为对称轴,其两侧碱基序列正读和反读都相同的双螺旋结构。旋转正读和反读都相同的双螺旋结构。旋转180 后对后对称重复称重复发卡结构发卡结构十字形结构十字形结构 这种重复序列具有极快的复性速度,即使在极稀的DNA浓度下也能很快复性,因此又称零时复性部分。 反向重复序列约占人

48、类基因组的5%,散布于整个基因组中,常见于基因组调控区,可能调控基因的复制和转录。(二)串联重复序列(tandem repeats) 有学者按是否编码区来分为两类。 1)编码区串联重复顺序:如组蛋白基因。编码五种组蛋白的基因密集在一个基本的7.0kb的重复单位上,各重复单位之间有高度的序列一致性。 2)非编码区串联重复顺序:常存在于间隔DNA和内含子内。是组成卫星DNA(satellite DNA)的基础。1. 卫星DNA( satellite DNA)的概念 当把断成约104 bp的DNA片段进行氯化铯(CsCl)密度梯度离心分析时,发现原核生物基因组DNA只出现一条宽带。而真核生物的基因组

49、DNA除了出现一条与原核基因组DNA一致的主要宽带外,在主要宽带的上方或下方还有其它条带。这些在主要条带上方或者下方的条带像是主要宽带的卫星,故称为卫星DNA。 卫星DNA的浮力密度与主要宽带不同是由于其(G+C)/(A+T)的比值与主带不同,并且高度重复。 如果DNA分子之间存在浮力密度的差异,在氯化铯密度梯度离心将会沉降于不同的位置。 DNA的浮力密度()与其G-C含量存在关系:=1.660+0.00098(G-C%)。 因此经过密度梯度离心,高度重复序列DNA可以在基因组DNA的主带旁形成一条或多条小带,这取决于其G-C含量及重复程度,故又称为卫星DNA或随机DNA。根据核心顺序的长短分

50、为大卫星DNA、小卫星DNA、微卫星DNA。 卫星序列是由寡核苷酸串联、重复排列 构 成 数 量 可 变 的 串 联 重 复 序 列(variable number of tandem repeats,VNTR)。 2. (大)卫星DNA(macrosatellite DNA) 又称为经典(卫星)DNA。总长度100kb几个Mb。 根据浮力密度的不同分为、和、卫星DNA。 各类型都由不同的重复顺序家族组成。 同一类型不同家族的成员之间的碱基组成的比例相同,因而有相同的浮力密度,但DNA序列未必相同。 原位杂交技术显示大量的卫星DNA容易在中期着丝粒周围集中。 大卫星DNA重复单位约5200bp

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 教案示例

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁