《微生物基因组学17636.ppt》由会员分享,可在线阅读,更多相关《微生物基因组学17636.ppt(60页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、微生物基因组学微生物基因组学一、概述1、微生物基因组学:是在微生物全基因测序的基础上,对单个基因或多个基因的作用、功能以及它们之间的相互关系的一门学科。2、微生物基因组学是人类基因组学的一部分:1994年美国首先发起微生物基因组研究计划,称为MGP计划(microbial genomic project,MGP),它是人类基因组计划的一个重要组成部分。3 3、微生物基因组学的主要研究内容、微生物基因组学的主要研究内容从研究工作的内容而言从研究工作的内容而言 结构基因组学结构基因组学功能基因组学功能基因组学比较基因组学比较基因组学从工作顺序而言从工作顺序而言 微生物基因序列的测定微生物基因序列的
2、测定微生物基因组的注释微生物基因组的注释微生物基因组的功能研究微生物基因组的功能研究二、微生物基因组的序列测定二、微生物基因组的序列测定测序目的测序目的 研究基因组的前提和基础。研究基因组的前提和基础。测序策略测序策略1.1.应根据待测序列的长度、要求测序的精确度和现有的条件应根据待测序列的长度、要求测序的精确度和现有的条件来制定测序策略。来制定测序策略。2.2.测序类型分为两类测序类型分为两类:确认性测序确认性测序 从头测序从头测序 大规模基因组测序的几个支撑技术大规模基因组测序的几个支撑技术v Sanger双脱氧末端终止法双脱氧末端终止法v PCR 技术技术1、克隆、克隆 2、水生栖热菌、
3、水生栖热菌(Thermus aquaticus)3、罗氏制药、罗氏制药v DNA 自动测序仪的发展自动测序仪的发展 AppliedBiosystems美国应用生美国应用生物系统公司物系统公司v 生物信息学分析软硬件设施生物信息学分析软硬件设施DNADNA测序有几种方法,但到目前为止最常用的测序有几种方法,但到目前为止最常用的是是2020世纪世纪7070年代中期发明的链终止(年代中期发明的链终止(Sanger Sanger 法)法)SangeristheonlychemisttohavereceivedtwoNobelPrizesinChemistry,thefirstasthesolereci
4、pientin1958forhisworkoninsulin,andthesecondin1980,sharedwithPaulBergandWalterGilbert,forthesequencingofnucleicacids.“双脱氧末端终止双脱氧末端终止双脱氧末端终止双脱氧末端终止”的含义的含义的含义的含义Sanger Sanger 双脱氧末端终止法测序原理双脱氧末端终止法测序原理双脱氧末端终止法测序原理双脱氧末端终止法测序原理自动化测序自动化测序荧光染料标记物的发明:荧光染料标记物的发明:使链终止法用于自动化测序,用不同的荧光使链终止法用于自动化测序,用不同的荧光色彩标记色彩标记dd
5、NTP,如,如ddATP标记红色荧光,标记红色荧光,ddCTP标记蓝色荧光,标记蓝色荧光,ddGTP标记黄色荧光,标记黄色荧光,ddTTP标记绿色荧光。由于每种标记绿色荧光。由于每种ddNTP带有带有各自特定的荧光颜色,而简化为由各自特定的荧光颜色,而简化为由1个泳道同个泳道同时判读时判读4种碱基。种碱基。第一代测序技术:第一代测序技术:Sanger等发明的双脱氧核苷酸末端终止法和等发明的双脱氧核苷酸末端终止法和Gilbert等发明的化学降解法。等发明的化学降解法。第二代测序技术第二代测序技术循环阵列合成测序法循环阵列合成测序法 第三代测序技术第三代测序技术(单分子测序,直接测序)(单分子测序
6、,直接测序)近期出现的近期出现的Helicos公司的公司的Heliscope单分子测序仪、单分子测序仪、Pacific Biosciences公司的公司的SMRT技术和技术和 Oxford Nanopore Technologies 公司正在研究的公司正在研究的纳米纳米孔单分子技术孔单分子技术,被认为是第三代测序技术。被认为是第三代测序技术。测序技术展望测序技术展望非光学显微镜成像:将核苷酸的空间线性排列方式可视化。非光学显微镜成像:将核苷酸的空间线性排列方式可视化。美国X奖基金会2006年10月4日宣布设立一项金额高达1000万美元万美元的奖金,激励科学家“多快好省”地绘制出人类基因图谱。规
7、则:在30天内以高精确度测序100个百岁老人基因组样本,并覆盖98%的基因组,每个基因组的测序费用控制在1000美元美元或以下。微生物基因组测序的策略微生物基因组测序的策略1.1.随机测序法随机测序法 即不考虑方向性,随机对靶即不考虑方向性,随机对靶DNADNA进行测序,最后采进行测序,最后采用计算机拼装而得到完整的序列信息。该方法又包括两种方法。用计算机拼装而得到完整的序列信息。该方法又包括两种方法。鸟枪法鸟枪法 它包含有三种消化法它包含有三种消化法限制性内切酶消化法限制性内切酶消化法超声波处理法超声波处理法胰胰DNADNA酶消化法酶消化法人工转座子法人工转座子法 转座子是具有跳跃功能的转座
8、子是具有跳跃功能的DNADNA元件,是细菌或酵母染色体上的特定基因区,元件,是细菌或酵母染色体上的特定基因区,利用转座酶可使转座子随机插入靶利用转座酶可使转座子随机插入靶DNADNA。优点:优点:一次体外反应即可形成大量转座子的插入。一次体外反应即可形成大量转座子的插入。可以在其上加入更有利于可以在其上加入更有利于DNADNA测序(或制图)的基因元件。测序(或制图)的基因元件。人工合成的转座子两头带有特殊的引物位点,所以插入位点人工合成的转座子两头带有特殊的引物位点,所以插入位点的两侧序列可有效迅速地得以确定。的两侧序列可有效迅速地得以确定。一段一段DNADNA顺序可以从原位上单独复制或断裂下
9、来,环化后插入另一位点,并对其顺序可以从原位上单独复制或断裂下来,环化后插入另一位点,并对其后的基因起调控作用,此过程称后的基因起调控作用,此过程称转座转座。转座子转座子 (transposons)(transposons)在原核生物与真核生物基因组中存在着可从一在原核生物与真核生物基因组中存在着可从一个染色体位点转移到另一位点的一些个染色体位点转移到另一位点的一些DNADNA序列。(文献上有时形象地序列。(文献上有时形象地称其为是跳跃基因,称其为是跳跃基因,jumping genejumping gene)。)。1951.Barbara McClintock 提出转作和跳跃基因的概念提出转作
10、和跳跃基因的概念 DNA1967年Shapiro才在E.coli中发现了转座因子2.2.定向测序法定向测序法 是指特定地从目的片段的某一端开始测序,直至把靶片段测完。定向是指特定地从目的片段的某一端开始测序,直至把靶片段测完。定向测序法包括引物测序法和定向缺失测序法。测序法包括引物测序法和定向缺失测序法。引物测序法引物测序法 即在第一次测序结果的基础上,设计新的寡核苷酸,来充当下一次测即在第一次测序结果的基础上,设计新的寡核苷酸,来充当下一次测序反应的引物,并依次类推,从而循序渐进获得靶序反应的引物,并依次类推,从而循序渐进获得靶DNADNA的全部序列。的全部序列。定向缺失法定向缺失法 定向缺
11、失法是将一个靶定向缺失法是将一个靶DNADNA变成若干套嵌套的缺失突变体,使靶序列中远变成若干套嵌套的缺失突变体,使靶序列中远不可测的区段逐渐落入可用通用引物进行测序的方法。不可测的区段逐渐落入可用通用引物进行测序的方法。作作图图法法测测序序与与序序列列组组装装 两种大规模基因组测序策略的比较两种大规模基因组测序策略的比较 项项项项 目目目目 策策策策 略略略略全基因组霰弹法全基因组霰弹法全基因组霰弹法全基因组霰弹法逐步克隆法逐步克隆法逐步克隆法逐步克隆法 遗传背景遗传背景遗传背景遗传背景不需要不需要不需要不需要需要(需构建精确的需要(需构建精确的需要(需构建精确的需要(需构建精确的物理图谱)
12、物理图谱)物理图谱)物理图谱)速度速度速度速度快快快快慢慢慢慢费用费用费用费用低低低低高高高高计算机性能计算机性能计算机性能计算机性能高(以全基因组为单高(以全基因组为单高(以全基因组为单高(以全基因组为单位进行拼接)位进行拼接)位进行拼接)位进行拼接)低(以低(以低(以低(以BACBAC为单位进为单位进为单位进为单位进行拼接)行拼接)行拼接)行拼接)适用范围适用范围适用范围适用范围工作框架图工作框架图工作框架图工作框架图精细图精细图精细图精细图代表测序物种代表测序物种代表测序物种代表测序物种果蝇、水稻果蝇、水稻果蝇、水稻果蝇、水稻人、线虫人、线虫人、线虫人、线虫24目前常用的人造染色体载体目
13、前常用的人造染色体载体目前常用的人造染色体载体目前常用的人造染色体载体细菌人工染色体载体(细菌人工染色体载体(BACBAC)酵母人工染色体载体(酵母人工染色体载体(YACYAC)黏粒载体(黏粒载体(cosmid)P1P1人工染色体载体(人工染色体载体(PACPAC)pYACpYAC4 4CEN4CEN4EcoRIEcoRIURA3URA3TELTELBamHIBamHITELTELorioriApApr rTRP1TRP1ARS1ARS1YAC载体的复制元件和标志基因YACYAC载体应含有下列元件:载体应含有下列元件:酵母染色体的端粒序列酵母染色体的端粒序列 酵母染色体的复制子酵母染色体的复制
14、子酵母染色体的着丝粒序列酵母染色体的着丝粒序列 酵母系统的选择标记酵母系统的选择标记大肠杆菌的复制子标记大肠杆菌的复制子标记YACYAC载体的装载量为载体的装载量为250-400kb250-400kb酵母人工染色体(Yeastartificialchromosomes简称YAC),是一种能够克隆长达400Kb的DNA片段的载体,含有酵母细胞中必需的端粒、着丝点和复制起始序列。细菌人工染色体(菌人工染色体(Bacterial artificial chromosome,BAC)是指一种)是指一种以以F质粒(粒(F-plasmid)为基基础建构而成的建构而成的细菌染色体克隆菌染色体克隆载体,常用来
15、克体,常用来克隆隆150kb左右大小的左右大小的DNA片段,最多可保存片段,最多可保存300kb个碱基个碱基对。(四)影响测序的因素(四)影响测序的因素不管采用随机测序还是定向测序都可碰到下列影响因素。不管采用随机测序还是定向测序都可碰到下列影响因素。1.1.计算机的设备计算机的设备 。2.2.靶靶DNADNA的性质。的性质。3.3.完成测序所需的时间完成测序所需的时间 。4.4.采用测序策略。采用测序策略。三微生物基因组的注释三微生物基因组的注释(一)概念:在微生物基因测序的基础上,对其基本结(一)概念:在微生物基因测序的基础上,对其基本结构和部件进行认定,以进一步研究其功能。构和部件进行认
16、定,以进一步研究其功能。(二)微生物基因组注释的内容(二)微生物基因组注释的内容1.1.碱基组成分析,即碱基组成分析,即G+C Mol%G+C Mol%测定。测定。G+CG+C含量是物种的一个重要特征,在微生物的分类上具有重要意义,是重含量是物种的一个重要特征,在微生物的分类上具有重要意义,是重要参数之一。要参数之一。2 2开放阅读框的鉴定:开放阅读框的鉴定:3 3编码序列分析编码序列分析4.tRNA4.tRNA基因检索:根据特异的三叶草结构来鉴定,可采用专门的分析软件。基因检索:根据特异的三叶草结构来鉴定,可采用专门的分析软件。5.rRNA5.rRNA基因检索:利用现有已知基因检索:利用现有
17、已知16srRNA16srRNA序列来鉴定基因组含的序列来鉴定基因组含的rRNArRNA基因。基因。6.6.特殊序列检索特殊序列检索7.7.复制原点鉴定复制原点鉴定(1 1)鉴定目的)鉴定目的 复制原点即微生物基因组复制原点即微生物基因组1 1号碱基的位置。号碱基的位置。(2 2)鉴定原理)鉴定原理 复制原点有其特殊的结构。如复制原点有其特殊的结构。如E.coliE.coli的复制原点为为一段的复制原点为为一段245245个个bpbp的序列,其中包含有四个核苷酸的的序列,其中包含有四个核苷酸的9 9聚体聚体“TTATCCACTTTATCCACT”。(3 3)鉴定方法)鉴定方法 可采用特殊的分析
18、软件。可采用特殊的分析软件。8.8.同源性基因检索同源性基因检索(1 1)目的)目的 对每一未知基因均进行同源性搜索以确定其对每一未知基因均进行同源性搜索以确定其基因的初步特性。基因的初步特性。(2 2)搜索原理)搜索原理 根据其结构、排列的同源性。根据其结构、排列的同源性。(3 3)搜索方法)搜索方法 采用美国的采用美国的BLASTBLAST软件。软件。四微生物的基因组图谱四微生物的基因组图谱微生物的基因组图谱主要包括两种,即遗传图谱和物理图微生物的基因组图谱主要包括两种,即遗传图谱和物理图谱。谱。(一一)遗传图谱遗传图谱1.1.概念概念 是通过突变表型鉴定出来的其基因组上的一系列基是通过突
19、变表型鉴定出来的其基因组上的一系列基因图,包括各个基因在基因组中的排列顺序和精确定位。因图,包括各个基因在基因组中的排列顺序和精确定位。2.2.建立基因遗传图谱的方法建立基因遗传图谱的方法(1)(1)中断杂交法中断杂交法 即将两个菌株共同培养即将两个菌株共同培养,并每隔一段时间中断培养并每隔一段时间中断培养,以鉴定其以鉴定其基因型基因型,并以鉴定某些基因的转化顺序和位置。并以鉴定某些基因的转化顺序和位置。(2)(2)噬菌体转导试验噬菌体转导试验 PIPI噬菌体是普遍性转导噬菌体。它可在供体菌的噬菌体是普遍性转导噬菌体。它可在供体菌的DNADNA断裂断裂时,误将时,误将DNADNA片段包装于自身
20、而带入受体菌的基因组中,并形成稳定的转导子。也片段包装于自身而带入受体菌的基因组中,并形成稳定的转导子。也可将紧密联锁的几个基因也转导过去(此为共转导)。可将紧密联锁的几个基因也转导过去(此为共转导)。(二)物理图谱(二)物理图谱1 1物理图谱的概念:是在物理图谱的概念:是在DNADNA分子上指出限制性内切酶的限制性位点、分子上指出限制性内切酶的限制性位点、数目及其限制性片段大小与排列顺序的图谱,又叫限制性图谱。数目及其限制性片段大小与排列顺序的图谱,又叫限制性图谱。2 2构建微生物基因物理图谱的意义构建微生物基因物理图谱的意义(1 1)用于基因克隆;)用于基因克隆;(2 2)用于序列分析;)
21、用于序列分析;(3 3)用于)用于southernsouthern杂交和杂交和RFLPRFLP多态性分析。多态性分析。3 3构建物理图谱的方法构建物理图谱的方法(1 1)限制性内切酶部分消化法)限制性内切酶部分消化法 (2 2)双酶消化法)双酶消化法 (3 3)内外切酶混合)内外切酶混合消化消化 (4 4)分子杂交)分子杂交 (5 5)SouthernSouthern十字杂交法十字杂交法五、微生物基因组功能分析五、微生物基因组功能分析1 1、根据目的基因组的性状而推测可能的基因组功能。、根据目的基因组的性状而推测可能的基因组功能。如致病岛的如致病岛的G+C mol%G+C mol%与细菌本身的
22、与细菌本身的G+C mol%G+C mol%有很大差异。致病岛或耐药岛等。有很大差异。致病岛或耐药岛等。2 2、根据已知的数据库进行同源性搜索。、根据已知的数据库进行同源性搜索。美国美国NIHNIH的的GenBankGenBank;欧洲的分子生物学实验数据库(;欧洲的分子生物学实验数据库(FMBLFMBL)日本的)日本的DNADNA数据库数据库(DDBJ)(DDBJ)3 3、利用不同条件、不同作用因素的影响而鉴定未知基因的功能。、利用不同条件、不同作用因素的影响而鉴定未知基因的功能。如用过氧化氢酶处理沙门氏菌而获得该菌的对如用过氧化氢酶处理沙门氏菌而获得该菌的对H H2 2O O2 2氧化应激
23、反应的基因。氧化应激反应的基因。4 4、采用基因敲除的方法来推测或确定基因的功能。、采用基因敲除的方法来推测或确定基因的功能。六、研究基因组功能的意义六、研究基因组功能的意义1 1 加速致病基因的研究加速致病基因的研究2 2 寻找灵敏而特异性的病原分子标记寻找灵敏而特异性的病原分子标记病原微生物的特异性病原微生物的特异性DNADNA序列可以作为分子标记用于疾病的诊断。序列可以作为分子标记用于疾病的诊断。3 3 促进新药的发现和疫苗的发展促进新药的发现和疫苗的发展(1 1)促进新药的发现)促进新药的发现 (2 2)疫苗的研究)疫苗的研究 4 4 促进微生物分类的发展促进微生物分类的发展5.5.提
24、高对人类相关基因功能的认识提高对人类相关基因功能的认识(1 1)一些人类的遗传性疾病,如结肠癌、肝豆状核变性、肾上腺脑白质)一些人类的遗传性疾病,如结肠癌、肝豆状核变性、肾上腺脑白质营养不良等,在细菌的基因组分析中,也存在类似的蛋白物。营养不良等,在细菌的基因组分析中,也存在类似的蛋白物。(2 2)可以利用微生物做模拟,去检测高等生物的基因性状和功能。)可以利用微生物做模拟,去检测高等生物的基因性状和功能。(3 3)从基因水平去揭发人类疾病与病原微生物之间关系,如发病机理,)从基因水平去揭发人类疾病与病原微生物之间关系,如发病机理,人类与病原微生物之间相互作用的基因机理等。人类与病原微生物之间
25、相互作用的基因机理等。七、微生物基因组功能学研究现状七、微生物基因组功能学研究现状(一)微生物基因组序列测定(一)微生物基因组序列测定1.1.病毒的基因组序列测定病毒的基因组序列测定2.2.原核细胞微生物的序列测定原核细胞微生物的序列测定19941994年美国发起微生物基因组计划,实质上就是以细菌基因组计划为开年美国发起微生物基因组计划,实质上就是以细菌基因组计划为开始的生物工程(不包括病毒)。始的生物工程(不包括病毒)。3.3.真核细胞微生物的序列测定真核细胞微生物的序列测定19961996年第一个完成酿酒酵母的测序,至目前为止,已有数种真菌测序完年第一个完成酿酒酵母的测序,至目前为止,已有
26、数种真菌测序完毕,尚有毕,尚有246246中正在测序之中。中正在测序之中。(二)微生物基因组测序碱基数(二)微生物基因组测序碱基数1.1.病毒基因碱基数:最小的病毒,如乙肝病毒,只有病毒基因碱基数:最小的病毒,如乙肝病毒,只有3kb3kb碱基数,而最碱基数,而最大的痘病毒则有大的痘病毒则有300kb300kb碱基数。碱基数。2.2.细菌基因组的碱基数:细菌基因组的碱基数同样差异很大,小至支原细菌基因组的碱基数:细菌基因组的碱基数同样差异很大,小至支原体为体为5050万万bpbp,大至黄色粘球菌为,大至黄色粘球菌为900900万万bpbp。3.3.真菌的碱基数:目前测定的微孢子虫为真菌的碱基数:
27、目前测定的微孢子虫为300300万万bpbp。4 4人类的碱基数为人类的碱基数为31.64731.647亿亿bpbp。(三)微生物的基因组数(三)微生物的基因组数1.1.病毒的基因组数病毒的基因组数 由数个至数百个。由数个至数百个。2.2.细菌的基因组数细菌的基因组数 由数百个至数千个。如百脉根中间根瘤菌为由数百个至数千个。如百脉根中间根瘤菌为80008000个基因组。个基因组。3.3.真菌的基因组数真菌的基因组数 基本上同细菌。如酿酒酵母为基本上同细菌。如酿酒酵母为60006000个。个。附:人类基因组数为附:人类基因组数为2-2.52-2.5万个,线虫万个,线虫2 2万个,果蝇万个,果蝇1
28、-1.51-1.5万个。万个。人类基因组计划人类基因组计划 HGP(Human Genome Projects)凯克加州大学20002000年年6 6月月26 26 人类基因组工作草图绘制成功。人类基因组工作草图绘制成功。20002000年年 3 3月月 果蝇。果蝇。1212月拟南芥基因组的完整图谱。月拟南芥基因组的完整图谱。20012001年年:HGPHGP和和美美国国塞塞莱莱拉拉公公司司将将各各自自测测定定的的人人类类基基因因组组工作框架图分别发表在工作框架图分别发表在NatureNature和和 Science Science 上。上。2002年,12月 Nature 小鼠的基因组。在在
29、人人类类基基因因组组计计划划中中,包包括括对对五五种种生生物物基基因因组组的的研研究究:大大肠肠杆杆菌菌、酵酵母母、线线虫虫、果果蝇蝇和和小小鼠鼠,称称之之为为人人类类的的五五种种“模式生物模式生物”。2000,4 2000,4 以杨焕明以杨焕明 在在ScienceScience 水稻全基因组框架序列图。水稻全基因组框架序列图。基因总数:约为人类的基因总数:约为人类的2 2倍;其中倍;其中1000010000个基因的功能已确个基因的功能已确定;水稻的定;水稻的“垃圾垃圾”序列多位于基因外,人类的序列多位于基因外,人类的“垃圾垃圾”序列多位于基因内;水稻的基因平均序列多位于基因内;水稻的基因平均
30、 4500bp,4500bp,人类基因平人类基因平均均 72000bp72000bp。拟南芥约有拟南芥约有2500025000个基因,个基因,80%80%在水稻中都存在,二者之间在水稻中都存在,二者之间有关信号传导的基因差别最大。有关信号传导的基因差别最大。中国家蚕基因组计划项目主持人、中国工程院院士向仲怀中国家蚕基因组计划主要攻关专家,西南农业大学教授夏庆友正在做测试。2003年人类表观基因组计划(HumanEpigenomeProject)于10月7日正式启动。这是世界上首项针对控制人类基因“开”和“关”的主要化学变化进行的图谱绘制工作,它将帮助科学家建立人类遗传与疾病之间的关键联系。20
31、04年10月国际人类基因组计划合作组织在Nature发了杂志上宣布误差小于10万分之一的人类基因组完成图已成功绘就。已将原来15万个“缺隙”减少到341个。完成图显示人类基因组只含有22.5万个基因。2005年8月在(Nature)杂志发表了水稻基因组水稻基因组“精细图精细图”,覆盖率达95.3,中国对国际水稻基因组计划的贡献率达20,共定位了37,500个基因,还率先完成了对着丝粒的测序。2005年9月1日出版的Nature和9月2日出版的Science杂志,黑猩猩和人类基因组的序列相似性达到99;即使考虑到序列插入或删除,两者的相似性也有96。封面文章。2014年10月28日迄今最古老人类
32、基因组测序完成,来源:中国科学报线粒体(四)微生物基因组的结构和功能的一些特点(四)微生物基因组的结构和功能的一些特点1.1.病毒基因组的结构和功能特点病毒基因组的结构和功能特点(1 1)病毒小,结构简单,与细菌和真核细胞生物相比,其基因组很小,各)病毒小,结构简单,与细菌和真核细胞生物相比,其基因组很小,各种病毒间也差异很大,约相差种病毒间也差异很大,约相差1 12 2个数量级。个数量级。(2 2)病毒的基因组)病毒的基因组(3 3)多数)多数RNARNA病毒的基因组是连续的,也有一部分病毒的基因组是连续的,也有一部分RNARNA病毒的基因组是不连病毒的基因组是不连续的续的(4 4)基因组重
33、叠现象)基因组重叠现象病毒基因组重叠现象是病毒基因组重叠现象是Sanger 1977Sanger 1977年研究年研究E.coliE.coli的噬菌体的噬菌体174174时发现的时发现的。该噬菌体是单链。该噬菌体是单链DNADNA分子,有分子,有53755375个核苷酸,可编码个核苷酸,可编码1111种蛋白质,总分子量为种蛋白质,总分子量为2525万左右,相当于万左右,相当于60786078个核苷酸的编码产物。个核苷酸的编码产物。病毒基因组重叠现象可以有两种情况:完全重叠病毒基因组重叠现象可以有两种情况:完全重叠 部分重叠部分重叠 (5 5)病毒的大部分基因编码蛋白质,只有一少部分基因不编码蛋
34、白质,这)病毒的大部分基因编码蛋白质,只有一少部分基因不编码蛋白质,这种不编码蛋白质的基因一般少于种不编码蛋白质的基因一般少于55。如如174174噬菌体的不编码的核苷酸为噬菌体的不编码的核苷酸为217217,占总基因数的,占总基因数的4.044.04,(217/5375217/5375),这些不编码的基因多数为基因表达的调控基因。),这些不编码的基因多数为基因表达的调控基因。人类的不编码蛋白的基因为人类的不编码蛋白的基因为9898,只有,只有22是编码蛋白的基因。是编码蛋白的基因。莲人在绿杨津 采 一 玉漱声歌新阙 采莲人在绿杨津,在绿杨津一阙新;一阙新歌声漱玉,歌声漱玉采莲人。(6 6)在
35、病毒的基因中,功能相当的蛋白质基因或)在病毒的基因中,功能相当的蛋白质基因或rRNArRNA基因往往聚集在基基因往往聚集在基因组的一个或几个特定的部位,形成一个功能单元或转录单元。它们可以一因组的一个或几个特定的部位,形成一个功能单元或转录单元。它们可以一起转录成含有多个起转录成含有多个mRNAmRNA的多顺反子,再剪接成单顺反子,再翻译成蛋白质,的多顺反子,再剪接成单顺反子,再翻译成蛋白质,如腺病毒等。如腺病毒等。(7 7)除反转录病毒外,其他病毒均为单倍体,每个基因在病毒颗粒中只)除反转录病毒外,其他病毒均为单倍体,每个基因在病毒颗粒中只出现一次。反转录病毒基因组则有出现一次。反转录病毒基
36、因组则有2 2个拷贝。个拷贝。(8 8)噬菌体的基因是连续的,而真核细胞的病毒的基因组鲜有内含子。)噬菌体的基因是连续的,而真核细胞的病毒的基因组鲜有内含子。除正链除正链RNARNA病毒外,真核细胞病毒都是转录成病毒外,真核细胞病毒都是转录成mRNAmRNA前体,再剪切加工,去掉内前体,再剪切加工,去掉内含子,形成成熟的含子,形成成熟的mRNAmRNA。(9 9)病毒适应性基因的丢失)病毒适应性基因的丢失2.2.细菌基因组结构和功能的一些特点细菌基因组结构和功能的一些特点(1 1)细菌的染色体数目)细菌的染色体数目 以前认为细菌的染色体数只有一条,经基因组研以前认为细菌的染色体数只有一条,经基
37、因组研究后,确定了细菌的染色体数是究后,确定了细菌的染色体数是1 1条以上。条以上。2 2细菌基因组的结构是连续的,无内含子,因而转录后不需要剪切就可细菌基因组的结构是连续的,无内含子,因而转录后不需要剪切就可形成成熟的形成成熟的mRNAmRNA转录起始前,有转录起始前,有3-103-10个个bpbp的的SDSD序列(即与序列(即与tRNAtRNA结合序列)。结合序列)。3 3具有操纵子结构,其中的结构基因为多顺反子。具有操纵子结构,其中的结构基因为多顺反子。4 4在多数情况下,结构基因在细菌染色体基因组中都是单拷贝的,但在多数情况下,结构基因在细菌染色体基因组中都是单拷贝的,但编码编码rRN
38、ArRNA的基因则是多拷贝的的基因则是多拷贝的5 5有编码同功酶的同基因(有编码同功酶的同基因(isogeneisogene)。)。6 6细菌的基因组不出现基因重叠现象。细菌的基因组不出现基因重叠现象。7 7在在DNADNA分子上,具有各种功能的识别区,如复制起始区分子上,具有各种功能的识别区,如复制起始区(oric)(oric)。复。复制终止区制终止区(Terc)(Terc),转录起始区和终止区等。这些区域往往具有特殊的序列,转录起始区和终止区等。这些区域往往具有特殊的序列,并含有反向重复序列。并含有反向重复序列。8 8在基因或操纵子的终末,往往具有特殊的终止序列,它可使转录终在基因或操纵子
39、的终末,往往具有特殊的终止序列,它可使转录终止,并使止,并使RNARNA聚合酶从聚合酶从DNADNA链上脱落。链上脱落。9 9毒立岛在细菌中普遍存在。毒立岛在细菌中普遍存在。毒力岛的概念是指编码细菌毒力基因簇的分子量较大的染色体或质粒DNA片段。此概念是1990年由Hacker等在研究泌尿系统致病性Ecoli编码毒力的两个相关基因而提出的。毒力岛又叫致病岛或毒力块、毒力盒(virulenceblocksorvirulencecassettes)等1010细菌基因的单向转移在细菌之间,甚至在古细菌和真细菌之间出现细菌基因的单向转移在细菌之间,甚至在古细菌和真细菌之间出现有大量的基因转移。有大量的
40、基因转移。1111在细菌基因中发现大量的未知基因,在已测序的细菌中,发现约有四在细菌基因中发现大量的未知基因,在已测序的细菌中,发现约有四分之一的基因为未知基因,有待于确定。分之一的基因为未知基因,有待于确定。1212适应性基因的缺失适应性基因的缺失 (1313)细菌)细菌DNADNA中中CpGCpG结构结构(许多基因,尤其是管家基因的启动子区,基因的末端通常存在一些富含双核苷酸“CG”的区域,称为“CpG岛”(CpGisland)。)CpGCpG结构是细菌结构是细菌DNADNA中胞嘧啶鸟嘌呤二核苷酸结构。是中胞嘧啶鸟嘌呤二核苷酸结构。是DNADNA刺激机体产生较强刺激机体产生较强免疫应答的结构,是抗核酸免疫的主要抗原。免疫应答的结构,是抗核酸免疫的主要抗原。1414)一批新的功能基因被揭晓)一批新的功能基因被揭晓