《第二章 基因和基因组.ppt》由会员分享,可在线阅读,更多相关《第二章 基因和基因组.ppt(91页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章第二章 基因和基因组基因和基因组genesandgenomes一、原核生物和真核生物一、原核生物和真核生物 l原核:原核:无核结构无核结构l真核:真核:核膜包围染色体核膜包围染色体l主主要要区区别别:细细胞胞结结构构、遗遗传传组组织织、细细胞胞的其他功能的其他功能 生物进化的三界学说嗜热细菌古细菌产甲烷细菌嗜盐细菌原核大肠杆菌真细菌土壤杆菌原始细胞枯草杆菌原生生物真核真菌植物动物二、原核生物染色体及其基因二、原核生物染色体及其基因1、E.coli染色体4.2106bp双链环状DNA,无核结构。相对集中产生类核,DNA占80%,RNA和蛋白质占20%,1000bp/基因。E.coli有30
2、00-4000个基因。相关术语介绍:l操纵子:功能上相关的几个结构基因相连,由一个共同的调节基因和一组共同的控制位 点 即 启 动 子(promoter)和 操 作 子(operator,也称操纵基因)。在基因表达时协调作用。这种基因表达调控结构组成一个单元,称为操纵子(也称为操纵元)。如E.coli中的乳糖代谢操纵子l操纵子组成包括结构基因、启动子和被调节基因产物识别的操纵基因调控子:一个调节基因的产物能调控几个操纵子基因的表达。这样几个操纵子加上它们的调节基因就是调控子结构基因:编码蛋白质的特定DNA序列,常为单拷贝。lRNA基因:仅转录合成RNA的特定DNA序列。多拷贝。l遗传密码:DN
3、A序列和相应蛋白质氨基酸之间的关系。通过mRNA中碱基的排列来联系。l密码子:mRNA中的三联体。l突变热点:DNA序列中特定区段容易发生突变的位点。顺反互补顺反互补-基因基因的认识的认识l可读框DNA中具有潜在编码蛋白质氨基酸的核苷酸序列。l编码区:DNA中对应于蛋白质中氨基酸序列的核苷酸序列。l转录单位:包括转录的启动子及其上游的其它调控区域、基因本身和转录的终止序列。l间隔区:基因序列中没有编码功能的区域。包括一些复制、转录、翻译过程的调控区段。2、噬菌体 lx174l单链环状DNA。5386核苷酸,11个基因,3个mRNA,翻译11种蛋白质,重叠基因和基因内基因。l噬菌体l48502b
4、p,双链DNA,(环状和线形分子)在E.coli中有两种形态存在,以分离的环状分子存在于寄主的细胞质中和以原噬菌体形式整合到寄主染色体中。cI溶原化的原因溶原化的原因三、真核生物基因组 1、真核生物基因组大小与C值矛盾基因组、染色体数目、C值C值矛盾(Cvalueparadox),人们无法用已知功能来解释基因组的DNA含量,所以产生了C值矛盾。与预期的编码蛋白质基因数量相比,基因组DNA含量过多。一些物种间的复杂性变化范围并不大,但C值却很大。常见试验动物的DNA含量2 2、基因组的基因数目、基因组的基因数目 a.全序列测定,酵母,1.3107bp,平均每个可读框为1.4kb。基因间的平均间隔
5、为600bp.则1.3107bp/1.4kb+600bp=6500(基因)b.可读框最大值c.表达基因数最小值d.致死基因数不等交换改变基因数目四、真核生物的染色体四、真核生物的染色体 l1.染色质和核小体异染色质组成型异染色质DNA序列不转录兼性异染色质X染色体常染色质l2.核小体染色体的基本结构单位200bpDNA+组蛋白(H2A,H2B,H3,H4)+H1染色质染色体,被压缩8000-10000倍四级结构核小体螺线体超螺线体染色单体核小体的组装H3和H4先形成四聚体,一个锁芯样结构,70-80bpDNA缠绕其上形成一圈螺旋,然后H2A和H2B形成异二聚体,结合于四聚体的两个侧面,各异二聚
6、体与30-40bpDNA结合各产生半圈螺旋,最后H1与DNA结合锁住核小体的进出口。3、着丝粒(centromere)功能:染色体分裂的完整性、连续性、两极分离性酵母菌的着丝粒序列(cen3)插入酵母菌质粒中。使质粒在细胞分裂表现出有规则地向子细胞分配行为。结构:DNA特殊序列,大多数着丝粒中含110bp的AT富集保守区,在其两侧是高度保守的序列(成分和成分)特征:不同物种的着丝粒中DNA序列不同,同种生物不同染色体的着丝粒结构也有差别。4端粒(telomere)l线性DNA分子末端特化了的序列,是特殊的二级结构。l端粒的DNA由许多短的正向重复序列组成。5端总是在富含C的链上,3端则在富含G
7、的链上。lCn(A/T)mn=18lGn(T/A)mm=14l具有一条单链末端,总是富含G的链,即带有3端。l端粒DNA单链末端不被核酸外切酶及单链特异性的内切核酸酶所识别。l人类端粒5TTAGGG-3,l端粒、着丝粒和DNA复制起点构成了染色体的不可缺少的三要素。l人 工 染 色 体(artificialchromosome)五五 真核生物的基因真核生物的基因l1真核生物DNA复性 动 力学真核生物DNA复性跨越78个数量级,复性可分为三个组分,每个组分代表基因组中不同复杂性的序列l第一相:快复性组分约占25Cot1042102,Cot1/2=0.0013l第二相:中间复性组分占30Cot0
8、.2100Cot1/2=1.9l第三相:慢复性组分占45Cot8010000Cot1/2=630l真核DNA的复杂性大于原核DNA.从Cot曲线可见原核的Cot曲线都呈“S”形。跨度一般分布2个数量级,表明原核DNA都是单一序列。lDNA复杂性为最长的没有重复序列的DNA核苷酸对数目。可通过E.coliDNA作为标准对被测DNA进行复杂性的计算:l4.2106bp样品DNACot1/2(观察可得)lXE.coliDNACot1/2(已知)各组分复杂性的计算是独立进行的,独立与标准各组分复杂性的计算是独立进行的,独立与标准DNADNA的的CotCot曲线比较。曲线比较。第三相第三相 占占4545
9、,其,其Cot Cot 浓度也是总浓度也是总CotCot的的45%45%,因而它实际上的,因而它实际上的CotCot1/21/2 应为应为6304563045283283,假定同样条件下,假定同样条件下,E.E.colicoli DNA DNA的的CotCot1/21/2 4 4,则代则代入以上计算入以上计算DNADNA复杂性的公式可得第三相慢复性复杂性的公式可得第三相慢复性组分的组分的动力学复杂性动力学复杂性。4.2106bp283X3.0108bp4同理第二组分为6105bp第一组分为340bpl化学复杂性是利用化学方法测量的结果。上例中DNA总浓度7.8108bp,其 中 第 3组 分
10、化 学 复 杂 性 为7.8108bp453.15108bp,该数据 和 按 复 性 动 力 学 估 算 的 结 果(3.0108bp)很接近。根据基因组总长度和每一组分的复杂长度,可计算出每一组分拷贝数l化学复杂长度基因组DNA总长度组分所占比例lfl动力学复杂长度动力学复杂长度l7.8108bp45l三相f1l3.0108bpll7.8108bp30l二相f350l6.0105bpl7.8108bp25l一相f500,000l3402、真核生物的单一序列,重复序列及卫星DNA l根据复性动力学研究结果可将真核DNA分为4种 单一序列单一序列非重复序列 轻度重复序列轻度重复序列在基因组中有2
11、10个拷贝,组蛋白基因、tRNA基因 中度重复序列中度重复序列在基因组中有10几百个拷贝一般不编码蛋白质,在基因调控中发挥作用l高度重复序列高度重复序列拷贝数几百几百万,如rRNAl基因。高度重复序列切成数百个碱基的片段进行超速离心,会在主要的DNA带的上面有一个次要的 DNA带相伴随。这就是卫星DNA(Satellite DNA),主要由长串联重复序列组成。一般对应于染色体上的异染色质区,位于着丝点区域。lll小卫星小卫星DNA(minisatellite DNA)由中等大小的串联重复序列组成。位于染色体末端区域,也可分散存在,一般不转录。有一个基本的核心序列(GGGCAGGAXC)。另一类
12、小卫星DNA是端粒DNA,主要有串联重复单位TTAGGG组成。l微卫星微卫星DNA(microsatellite DNA)重复单位多为二核苷酸,也有少量三核苷酸和四核苷酸,分散存在于基因组中,可作为基因的标记。小卫星DNA的应用原核生物含完全不重复DNA,低等真核大部分为非重复,重复组分不超过30。基本为中度重复,高等真核中近一半为中度或高度重复。l真核DNA的四种类型并非在每一生物中都存在。l多倍体植物中没有非重复序列。螃蟹基因组中没有中度重复。l基因组大小和非重复DNA在低等简单的生物中有正比关系。即基因组增加,非重复DNA长度增加。l当基因组大小在3.0109bp以上时,基因组增加,非重
13、复DNA组分不增加,只是重复组分增加。3.割裂基因和重叠基因 基因不连续,即为割裂基因(interruptedgene)指基因的编码序列在DNA分子上不是连续排列的,而是被不编码的序列所隔开(鸡卵清蛋白基因),外显子(外元,exon)对应于mRNA序列,基因两端起始和结束都是外显子。内含子、(内元,intron)不编码的序列,在成熟mRNA中消失.鸡的鸡的卵清卵清蛋白蛋白基因基因割裂基因的特性 l1、外显子广泛存在于各种生物不同的基因中,编码蛋白质基因、rRNA、tRNA.l真核生物大多数是割裂基因,古细菌中少见,真细菌中没有。l2、外显子排列顺序和其在成熟mRNA中排列顺序相同l3、某种割裂
14、基因在所有组织中都具有相同的内含子成分l4、内 含 子 通 常 在 所 有 的 可 读 框 中 都 含 有无义密码子,一般无编码功能l外显子与生物进化 l通过DNA杂交,如一个外显子与其它基因外显子片段互补,则表明这两个基因可能起源于共同祖先。经基因扩增后的进化过程逐渐扩大差距而形成不同的基因。l基因内含子之间的亲缘关系远不如外显子之间的关系密切,内含子突变后不影响蛋白质的结构,外显子突变后影响蛋白质结构被自然选择淘汰,而表现内含子在进化过程中变化较大、较快,内含子就避免了选择压力而自由积累。重叠基因重叠基因不同起点不同起点不同编码框不同编码框外显子的选择性连接可产生不同的mRNA,产生重叠基
15、因。外显子和内含子相对而言存在。4.基因家族和基因簇l来源相同,结构相似。功能相关的一组基因为基因家族(genefamily)l家族成员有序列相关性。但相关程度和组织形式不同。l基因家族成员分布在特定染色体区域。也可分散存在于同一染色体。甚至不同的染色体家族成员紧密成簇排列成大段的串联重复单位。并定家族成员紧密成簇排列成大段的串联重复单位。并定位于特定的染色体区域内。称为基因簇(位于特定的染色体区域内。称为基因簇(gene gene clustercluster)l血红蛋白基因家族l血红蛋白由两两相同的四个亚基和四个血红素组成,在成人中,亚基为和。不同发育时期血红蛋白组成的亚基不同。这些亚基在
16、结构和功能上可归结为2类:类链和类链l类链的基因彼此靠近而串联在一起构成基因簇。位于11号染色体l类链的基因彼此靠近成簇,位于16号染色体串联重复基因l组蛋白基因,编码5种组蛋白的基因:H1、H2A、H2B、H3、H4,彼此靠近而构成一个重复单位。l该基因中没有内含子,但存在不转录的间隔区。l鸡重复数10,哺乳动物20个,果蝇100个,lrRNA基因原核5s,16s,23sl真核5.8s,18s,28s,和5sl5s的拷贝数多,但不是RNA聚合酶转录,而是RNA聚合酶转录,分散存在。ltRNAl酵母tRNA,长约140kb,有内含子,但各内含子没有序列的共同性。串联重复基因和基因家族的区别 l
17、串联重复基因各成分间有高度的序列一致性甚至完全相同。基因家族各成员的差别较大。l拷贝数较高。常有几十几百个。基因家族拷贝数不高。l非转录的间隔区短而一致。基因家族各成员的非转录的间隔长短不一l5、细胞器基因 l叶绿体、线粒体含有DNA,环状、非重复。同一线粒体或叶绿体内含有相同环状DNA。l叶绿体、线粒体均编码自身所需的某些蛋白质及rRNA,tRNA。其余所需的蛋白质均由核基因编码。l叶绿体、线粒体的膜不允许核酸的通过。其合成的rRNA,mRNA和tRNA只能在细胞器内行使功能,进行翻译,合成系统是细胞器专用的。6、基因鉴定 l构建DNA物理图谱的基本目的就是在特定染色体区域内对基因定位。l基
18、因的编码区和非编码区有以下区别基因的编码区和非编码区有以下区别:l1活化基因都能表达并产生RNA产物-mRNA,mRNA可与DNA的基因序列杂交。l2基因DNA序列是保守的,编码产物的序列发生突变往往对生物体不利而被自然选择淘汰,所以DNA的编码序列与非编码序列相比在进化上十分保守。l3编码区如发生突变产生终止密码子,将使其产物丧失功能而使突变基因淘汰,非编码区产生的终止密码子突变则不被淘汰。所以,基因编码区的序列通常比非编码区含较长的可读框。1.与RNA或cDNA杂交 l利用待测的DNA克隆作为杂交探针,和不同组织中的mRNA或者总RNA进行Northern印迹杂交,出现阳性则表明在克隆片段
19、中可能存在基因。这时可用适当的cDNA文库进一步筛选。l不足之处:l基因表达有组织、发育时期局限性,有时RNA产物或cDNA文库中无此基因产物。l外显子序列在探针中的比例可能很低,杂交信号不高,很难检测出杂交的阳性信号。2.Zoo-blot 杂交 l该法利用基因的保守特性和可读框较长的特点检测基因的存在。l测试样本首先和不同种类的基因组DNA进行Southern杂交,产生阳性杂交信号的基因组DNA可能含进化上十分保守的编码序列。然后测序检查能够杂交的序列中是否含有可读框。可分离出未知的但具有某些功能的基因。3.外显子捕获 (exon trapping)l它所采用的载体含有强启动子和被内含子中断
20、的两个外显子,载体的内含子序列中含有限制酶位点,用于插入待测的DNA片段。当待测DNA片段插入时,通过转录产生含两个外显子序列的RNA。如待测片段不包含新外显子,在剪接图谱上不会发生变化,mRNA含有与亲代载体相同的序列。l如待测片段含有新外显子而且外显子两侧有部分内含子序列,mRNA加工时,这个外显子两侧的剪接位点被识别。外显子的序列就插入RNA载体的两个外显子间,表明捕捉到了外显子。4.CG岛鉴定l脊椎动物基因常伴随CG岛(CGisland)。CG岛是短的低甲基化的富含CG的序列,常在基因的5端。CG岛内有些稀有的内切酶位点,这些酶切位点的紧密成簇存在表明含有CG岛,然后进行Southern印迹可鉴定基因。l无CG岛的基因不适用5.DNA序列的计算机分析鉴定 l同源分析:对DNA核苷酸序列和相应的氨基酸序列与记录在数据库中的DNA和蛋白质比较。序列间明显符合表明与基因有关。l外显子预测:适用于大量DNA序列的检测。扫描DNA序列,检测是否含有外显子与内含子剪接处和剪接分支位点处的保守序列,是否存在相对长的可读框,鉴定可能的外显子。本章要点l真核生物基因组l染色质何染色体结构l着丝粒结构lDNA复性动力学l单一序列DNAl重复序列DNAl卫星DNAl割裂基因l基因家族和基因簇l基因鉴定的方法和原理