《第二章基因PPT讲稿.ppt》由会员分享,可在线阅读,更多相关《第二章基因PPT讲稿.ppt(62页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章基因第1页,共62页,编辑于2022年,星期二2.22.2基因组学时代(基因组学时代(genomics era)genomics era)基因的概念与界定基因的概念与界定 基因组(基因组(genome)genome):一个生物体的细胞中或病毒:一个生物体的细胞中或病毒 中所含有的完整的整套基因。(例如:细胞核基中所含有的完整的整套基因。(例如:细胞核基 因组;叶绿体基因组;噬菌体基因组。)因组;叶绿体基因组;噬菌体基因组。)基因:是一段制造功能产物的完整的染色体片段。基因:是一段制造功能产物的完整的染色体片段。基因的产物是蛋白质,也可能是基因的产物是蛋白质,也可能是RNA.RNA.鉴别基
2、因五项标准鉴别基因五项标准2.2.12.2.1可读框可读框 open reading frame,ORF open reading frame,ORF2.2.22.2.2序列特征序列特征 密码子偏爱及作用密码子偏爱及作用2.2.32.2.3序列保守序列保守 非转录的调控单元非转录的调控单元 适当进化距离的相关个体的序列信息的比较适当进化距离的相关个体的序列信息的比较第2页,共62页,编辑于2022年,星期二2.2.42.2.4基因功能的证据基因功能的证据转录转录 cDNA cDNA探针与全部染色体序列的微阵列进行杂交探针与全部染色体序列的微阵列进行杂交2.2.52.2.5基因失活基因失活 RN
3、A RNA干涉(干涉(RNAiRNAi)明显的现象型明显的现象型 酵母酵母 2.2.62.2.6基因重叠与断裂基因重叠与断裂2.2.72.2.7假基因(假基因(pseudogene)pseudogene)定义定义 动物、植物、真菌、微生物动物、植物、真菌、微生物 假基因与真基因没有绝对的界限假基因与真基因没有绝对的界限 假基因是进化的终点假基因是进化的终点第3页,共62页,编辑于2022年,星期二2.32.3蛋白质基因概念的提出蛋白质基因概念的提出 朊病毒(朊病毒(prion)prion)定义:一种只含蛋白质而不含核酸的感定义:一种只含蛋白质而不含核酸的感染原,可导致人、畜的中枢神经退化疾病。
4、染原,可导致人、畜的中枢神经退化疾病。如:疯牛病(牛海绵样脑软化病如:疯牛病(牛海绵样脑软化病,BSE,BSE)完整的朊病毒完整的朊病毒 分子量分子量33-35kD33-35kD PrP PrPScSc病原体,可以作为模板,把细胞中具有正常病原体,可以作为模板,把细胞中具有正常 功能的功能的PrPPrPC C转变为转变为PrPPrPScSc;PrP PrPC C和和PrPPrPScSc的一级结构相同,被同一基因编码,的一级结构相同,被同一基因编码,但它们的立体构象不同,但它们的立体构象不同,PrP PrPScSc比比PrPPrPC C具有高得多具有高得多 的的 折叠结构。折叠结构。PrPPrP
5、ScSc具有抗蛋白酶的性能;具有抗蛋白酶的性能;PrP PrPC C对蛋白酶敏感。对蛋白酶敏感。朊病毒是一种由蛋白质组成的基因朊病毒是一种由蛋白质组成的基因?Wickner R B,Taylor K L,Edskes H K et al.Wickner R B,Taylor K L,Edskes H K et al.Microbiology and Molecular Biology Review,Microbiology and Molecular Biology Review,1999,63(4):844 1999,63(4):844861861第4页,共62页,编辑于2022年,星期二酵
6、母中的酵母中的URE3 PSI Het-sURE3 PSI Het-s不是传染性病毒不是传染性病毒的朊病毒的朊病毒,是一种细胞内的非孟德尔式的蛋白质遗传是一种细胞内的非孟德尔式的蛋白质遗传因子。因子。URE3URE3是一种对氮异化代谢酶的转录起负调控作用的是一种对氮异化代谢酶的转录起负调控作用的蛋白质。蛋白质。2.42.4组蛋白密码组蛋白密码对基因对基因“唯唯DNA”DNA”的质疑的质疑 histone code histone code 基因可能是基因可能是DNADNA与蛋白质的结合体与蛋白质的结合体 第5页,共62页,编辑于2022年,星期二2.4.1DNA2.4.1DNA后成遗传与印记基
7、因后成遗传与印记基因 DNA DNA后成遗传学由胚胎学家后成遗传学由胚胎学家Waddington1953Waddington1953年提年提出。出。后成遗传:(后成遗传:(epigenetic inheritance epigenetic inheritance)是指基于非基因是指基于非基因序列改变所致基因表达水平变化,序列改变所致基因表达水平变化,如如DNADNA甲基化和染色质甲基化和染色质构象变化等构象变化等。印记基因(印记基因(imprint gene)imprint gene):由于一些可遗传的修饰作用:由于一些可遗传的修饰作用(如甲基化)使配子(精子或卵子)中某个单一的等位基(如甲基
8、化)使配子(精子或卵子)中某个单一的等位基因的活性(因的活性(monoallelic activitymonoallelic activity)在胚胎发育中具有标记性)在胚胎发育中具有标记性特点。特点。DNA DNA甲基化是后成遗传的,独立于甲基化是后成遗传的,独立于DNADNA密码遗传密码遗传之外。之外。第6页,共62页,编辑于2022年,星期二在小鼠早期胚胎中,父系等位基因为非甲基化而表在小鼠早期胚胎中,父系等位基因为非甲基化而表达,母系等位基因因甲基化而沉默。达,母系等位基因因甲基化而沉默。在子代小鼠形成配子时发生了什么?在子代小鼠形成配子时发生了什么?第7页,共62页,编辑于2022年
9、,星期二亲代小鼠是雄性:贡献给精子的等位基因必定是非甲基化的,当母系基因出现在精子中,必须要经过去甲基化;亲代小鼠是雌性:贡献给卵子的等位基因必定是甲基化的,当父系等位基因出现在卵子中,则甲基必定要加入进去。第8页,共62页,编辑于2022年,星期二2.4.22.4.2组蛋白乙酰化和甲基化组蛋白乙酰化和甲基化 核小体核小体 组蛋白八聚体(组蛋白八聚体(H H3 3,H H4 4,H H2 2A A,H H2 2B B)组蛋白的组蛋白的乙酰化酶乙酰化酶可使组蛋白可使组蛋白乙酰化乙酰化,使基因活使基因活 化化activeactive;组蛋白的组蛋白的甲基化酶甲基化酶可使组蛋白甲基化,可使组蛋白甲基
10、化,使基因失活使基因失活silencedsilenced;例:组蛋白例:组蛋白H H3 3甲基化后,可以与甲基化后,可以与HP1HP1蛋白结蛋白结合,合,HP1HP1蛋白有阻止转录的作用。蛋白有阻止转录的作用。去乙酰化酶与去乙酰化酶与DNADNA甲基化酶的活动相关联进行;甲基化酶的活动相关联进行;去乙酰化作用使甲基化作用发生(一般);去乙酰化作用使甲基化作用发生(一般);第9页,共62页,编辑于2022年,星期二2.4.32.4.3组蛋白密码假说组蛋白密码假说 “组蛋白密码组蛋白密码”:组蛋白的共价键修饰(组蛋白的共价键修饰(covalent covalent modificationmodi
11、fication)诸如诸如甲基化甲基化、乙酰化乙酰化、磷酸化磷酸化等在组蛋等在组蛋白上是以组合的形式进行的,这种组合形式称为白上是以组合的形式进行的,这种组合形式称为“组蛋白密码组蛋白密码”。这些化学修饰改变了染色质的。这些化学修饰改变了染色质的结构,使结构,使DNADNA(基因)的转录打开或关闭,对基因(基因)的转录打开或关闭,对基因的表达进行调控。的表达进行调控。Jenuwein T,AllisCD.Science,2001(293):1064 Jenuwein T,AllisCD.Science,2001(293):1064 1067 1067第10页,共62页,编辑于2022年,星期二
12、2.5基因与DNA2.5.1 Z-DNA构象是另一种遗传信息编码 Z-DNA只有小沟,没有大沟。Z-DNA在负超螺旋下产生,RNA转录酶 沿DNA移动后产生的负超螺旋。Z-DNA参与编辑遗传信息的生物大分 子复合体的装配。DNA的不同构象是一种遗传信息?第11页,共62页,编辑于2022年,星期二中心法则强调的是:DNA序列信息的逐个的精确传递,即模板式的信息传递。突变是遗传信息改变的唯一途径。对Z-DNA的研究表明:DNA除了以它的一级结构含有蛋白质中的氨基酸序列信息外,DNA的不同构像也是一种遗传信息。第12页,共62页,编辑于2022年,星期二2.5.2 C值矛盾值矛盾(C-value
13、paradox)C值:在每一种生物中其单倍体基因组的DNA总量是特异的,被称为C值。C值矛盾:C值和生物结构或组成的复杂性不一致的现象称为C值矛盾。第13页,共62页,编辑于2022年,星期二第14页,共62页,编辑于2022年,星期二可能产生的原因是什麽?冗余DNA(重复序列)生物的复杂性与遗传信息成正比 DNA所含的并不全是遗传信息 全部的遗传信息也不都包含在DNA 之中 生物的复杂性并不与DNA含量成正比第15页,共62页,编辑于2022年,星期二2.5.3 N值佯谬 定义:这种基因数目与生物进化或生 物复杂性的不对应性,称为N值佯谬。可能原因?决定生物进化程度或复杂性的遗传信 息并不全
14、部包含在DNA之中。第16页,共62页,编辑于2022年,星期二2.62.6重复序列重复序列2.6.12.6.1单一序列单一序列(Unique sequence)(Unique sequence)和重复序列和重复序列 单一序列单一序列 :是指在基因组中只有是指在基因组中只有1 1个或几个拷个或几个拷 贝。贝。短片段的重复序列按排列方式可分为三种类型:短片段的重复序列按排列方式可分为三种类型:(1 1)正向重复正向重复正向重复正向重复(direct repeats)(direct repeats);(2 2)反向重复反向重复反向重复反向重复(inverted repeats)(inverted
15、repeats);ATGCAATGCAACAGTTCAG CTGAACTGTACAGTTCAG CTGAACTGTATGCAATGCA TACCTTACCT TGTCAAGTTTGTCAAGTT GACTTGACAGACTTGACATACGTTACGT (3 3)回文序列回文序列回文序列回文序列(Palindromic sequence)(Palindromic sequence)5 5 GTGAGCTCAC 3 GTGAGCTCAC 3 3 3 CACTCGAGTG 5 CACTCGAGTG 5 第17页,共62页,编辑于2022年,星期二长片段的重复序列分为轻度重复、中度重复和高度长片段的
16、重复序列分为轻度重复、中度重复和高度重复三种。重复三种。轻度重复序列轻度重复序列 在基因组中含有在基因组中含有2-102-10拷贝拷贝 ,酵母酵母tRNAtRNA基因、人和小鼠的珠蛋白基因等。基因、人和小鼠的珠蛋白基因等。中度重复序列中度重复序列 长约长约300bp300bp 基因组中约有基因组中约有1010几千个拷贝的序列几千个拷贝的序列 如如rRNArRNA和和tRNAtRNA基因基因 tRNA tRNA基因一般都分散分布于基因组中,而基因一般都分散分布于基因组中,而rRNA rRNA 常集中分布于核仁形成区。常集中分布于核仁形成区。第18页,共62页,编辑于2022年,星期二2.6.2
17、Alu家族(Alu family)重复序列的代表n n 长约300bp;Alu序列也称为短的分散因子(short interspersed elements,SINEs)。n n 由RNA多聚酶III转录的;n n 在人类基因组中30 万个拷贝;n n 在170bp处有一AluI 的酶切位点;n n 由两个130bp的串联重复顺序组成;n n 在二聚体的右半部有31bp插入序列,此插入 序列来自7SL RNA。7SL RNA7SL RNA基因编码基因编码SRPSRP颗粒中的颗粒中的RNARNA成分,成分,SRPSRP在肽链合成中起作用在肽链合成中起作用第19页,共62页,编辑于2022年,星期
18、二 RNA聚合酶I位于核仁,负责rRNA(5.8S、18S和28S)的转录。由于rRNA占总RNA的比例最大,所以RNA聚合酶I负责了细胞内大部分RNA的转录;RNA聚合酶II位于核质,负责mRNA的前体,即核内不均一RNA(heterogenous nuclear RNA,hnRNA)和几种核内小RNA的转录;RNA聚合酶III也位于核内,负责tRNA、5S rRNA、Alu序列和其他小RNA(small RNA,sRNA)的转录。第20页,共62页,编辑于2022年,星期二 AluI 31bp Alu序列第21页,共62页,编辑于2022年,星期二Alu序列有何应用价值?在人类基因组中,约
19、平均每隔6kb有一个Alu序列,可作为人类DNA片段的特异标记;推测Alu序列与真核生物基因组的复制起点有关;可能与基因的转录、调控有关;Alu序列是可移位成分,可引起DNA重排,从而引发细胞分化。第22页,共62页,编辑于2022年,星期二 L1 家族 重复序列代表 n n长6500bp左右n n 称为长的分散因子(long interspersed elements,LINEs)n n 在哺乳动物基因组中约6万个拷贝n n 由RNA多聚酶转录n n 属于一种转座因子n n所有真核生物中都有SINEs和LINEs。果蝇和鸟类含LINEs较多,人类和蛙中SINEs较多。第23页,共62页,编辑
20、于2022年,星期二2.6.3高度重复顺序 可重复达十万次,有的重复单位长度不 超过6bp。氯化铯梯度离心 G+C含量越高,浮力密度越大 卫星DNA(satellite DNA)隐蔽卫星DNA(cryptic satellite)自私 DNA(selfish DNA)伊甸园 DNA(Garden of Eden DNA)第24页,共62页,编辑于2022年,星期二n n小卫星 (minisatellite)又叫同向重复序列可变数(variable number tandem repeat VNTRs)串联重复序列;在人类中此序列由15100nt的重复单 位组成;一个VNTR位点是1 5kb;在
21、不同个体中,这种串联重复序列的数目和位置都不相同(多态性)DNA指纹(DNA fingerprints)第25页,共62页,编辑于2022年,星期二人类人类VNTRsVNTRs的第一个探针的第一个探针n n1985年由Alec Jeffries制备 n n 在肌红蛋白基因的第一个内含子中n n 分离出132bp的重复顺序n n 内含4个长33bp的重复单位n n 内有13bp为核心顺序n n(GGAGGTGGGCAGG)n n在群体中VNTRs存在着多态性第26页,共62页,编辑于2022年,星期二人类DNA指纹标本3和犯罪现场的DNA指纹相同第27页,共62页,编辑于2022年,星期二第28
22、页,共62页,编辑于2022年,星期二第29页,共62页,编辑于2022年,星期二2.7重复基因 基因簇(gene cluster):一组相同或相关的基因排列在一起称为基因簇。基因家族(gene family):是指由1个祖先基因经重复和变异所产生的一组同源基因,称为基因家族。第30页,共62页,编辑于2022年,星期二核糖体RNA基因,rRNA基因(rDNA)是一种中等重复并有转录活性的基因;一个重复单位由转录区和非转录区组成;转录区由rRNA前体(45S)编码;转录后45S前体被切成28S、5.8S和18S;多余部分的核苷酸是内含子被切除。第31页,共62页,编辑于2022年,星期二第32
23、页,共62页,编辑于2022年,星期二第33页,共62页,编辑于2022年,星期二组蛋白基因是已知的重复基因中唯一具有蛋白质编码机能的基因。海胆的每一个组蛋白基因簇都是一个含有5种组蛋白编码的重复单位,可重复千次。第34页,共62页,编辑于2022年,星期二2.8重叠基因(overlapping gene)n n 莲人在绿杨津 采 一 玉漱声歌新阙 n n采莲人在绿杨津,在绿杨津一阙新;一阙新歌声漱玉,歌声漱玉采莲人。第35页,共62页,编辑于2022年,星期二n n19771977年年SangerSanger首先发现重叠基因首先发现重叠基因n n他对单链环状的噬菌体他对单链环状的噬菌体X17
24、4X174进行了测序。进行了测序。5386 5386核苷核苷酸,酸,1111个基因,个基因,3 3个转录单位,由个转录单位,由3 3个启动子个启动子(pA,pB,pDpA,pB,pD)启动。)启动。n nX174X174含有的含有的5386nt5386nt最多能编码最多能编码17951795个氨基酸,若个氨基酸,若每个氨基酸的平均分子量为每个氨基酸的平均分子量为110110,则总的蛋白质分,则总的蛋白质分子量为子量为197,000Da197,000Da,但实际蛋白质总分子量却为,但实际蛋白质总分子量却为262,000D262,000D。n n将全部将全部DNADNA序列和蛋白质的氨基酸序列进行
25、比较,序列和蛋白质的氨基酸序列进行比较,发现了重叠基因。发现了重叠基因。第36页,共62页,编辑于2022年,星期二第37页,共62页,编辑于2022年,星期二重叠基因重叠基因 Overlapping Genes第38页,共62页,编辑于2022年,星期二重叠基因仅在噬菌体(如 X174;G4)和病毒(如SV40)中存在,在真核生物中尚未发现重叠基因。重叠基因可经济利用基因组。产生原因:可能是由于基因组比较小,但又必须要编码一些维持生命和繁殖的基因,在选择的压力下,保留了重叠基因的形式。第39页,共62页,编辑于2022年,星期二2.9 断裂基因n n内含子(intron)n n外显子(exo
26、n)2.9.1内含子的发现n n1977 美Sharp&Roberts 同时发现了断断裂裂基基因因(split gene),1993年获得了诺贝尔奖。第40页,共62页,编辑于2022年,星期二鸡卵清蛋白基因的结构第41页,共62页,编辑于2022年,星期二2.9.2内含子的结构特点 1内含子和外显子的分布真核生物一般都含有内含子,但也有少数基因不含内含子(如组蛋白基因,干扰素基因,酵母的多数蛋白质基因)。第42页,共62页,编辑于2022年,星期二2内含子的相对性 SV40病毒早期转录区编码了T和t两个功 能不同的蛋白。内含子是相对的,一个基因的内含子可 能是另一个基因的外显子。第43页,共
27、62页,编辑于2022年,星期二第44页,共62页,编辑于2022年,星期二3内含子的生物学意义(1)有的内含子可编码内切酶 成熟酶(maturase)归巢(Homing)第45页,共62页,编辑于2022年,星期二第46页,共62页,编辑于2022年,星期二第47页,共62页,编辑于2022年,星期二3内含子的生物学意义(2)调控 通过内含子的相对性可使相同的一段DNA编码不同的蛋白,起到了调控的作用,并增加了遗传信息的储存。第48页,共62页,编辑于2022年,星期二(3)提高进化速度内含子的进化速度快于外显子。比较不同种属的同一条基因时,有时外显子是相同的,而内含子由于变化太大而无法识别
28、出相应的序列。外显子和内含子中发生的突变概率相同。在外显子中突变可因不利选择而被有效的去除;内含子没有选择压力,能自由地积累碱基替换和长短改变(缺失和插入)。原核生物没有内含子是有利的?第49页,共62页,编辑于2022年,星期二在内含子区可以产生基因的重复,进化中形成基因簇及同工酶基因。内含子和外显子的交界处突变时,在保留原有蛋白的同时,可产生一种新的蛋白,具有进化优势。第50页,共62页,编辑于2022年,星期二2.10转座子转座子的移动提供了基因组变化的潜在可能。1转座子(transposon,Tn)定义:转座子是基因组上不必助于同源序列就可移动的DNA片段,它们可以直接从基因组内的一个
29、位点移到另一个位点。转座因子(transposable element),插入序列(insertional sequence),跳跃基因(jumping gene)第51页,共62页,编辑于2022年,星期二2原核生物转座子的分类和结构特征 两种类型的转座子:简单转座子(simple transposon)复合转座子(composite transposon)所有转座子都有两个结构特征:两端都有2040bp的反向重复序列 (inverted repetitive sequence,IR)。具有编码转座酶的基因,这种酶催化转 座子插入新的位置。第52页,共62页,编辑于2022年,星期二简单转座
30、子n n简单转座子又称插入序列(insertion sequence,IS)。n n IS都是很小的DNA片段(1kb),含有转座酶基因负责IS的移动,末端具有倒置重复序列(反向重复序列)。n n转座时往往复制宿主靶位点一小段(415bp)DNA,形成位于IS序列两端的正向重复区。第53页,共62页,编辑于2022年,星期二第54页,共62页,编辑于2022年,星期二复合转座子n n复合转座子除了含有与它的转座作用有关的基因外,还含有其它基因,如抗药基因,其两翼是两个相同或高度同源的IS序列;n n表明IS序列插入到某个功能基因两端时就可能产生复合转座子。第55页,共62页,编辑于2022年,
31、星期二第56页,共62页,编辑于2022年,星期二3转座作用的机制n n转座酶既识别转座子的两末端,也能与靶位点序列结合,靶DNA在插入位点存在正向重复。n n 转座作用的机制是转座子插到新的位点上产生交错切口,所形成的突出单链末端与转座子两端的反向重复序列相连,然后由DNA聚合酶填补缺口,DNA连接酶封闭切口。第57页,共62页,编辑于2022年,星期二4真核生物转座子有三种类型n n真核生物的转座子,除了两端具有反向重复序列,它们的两端还因为具有其他的序列结构,以及经RNA中间体转座而与原核不同。第58页,共62页,编辑于2022年,星期二末端结构末端结构 含有的基因含有的基因 转座方式转
32、座方式 例子例子 末端短的反末端短的反向重复序列向重复序列 编码转座酶编码转座酶 以以DNADNA形式,形式,经复制或切经复制或切离而转座离而转座TamTam3 3(金(金鱼草)鱼草)末端长的同末端长的同向重复序列向重复序列(LTRsLTRs)编码反转录编码反转录酶酶类似类似RNARNA病病毒毒 经经LTRLTR的启的启动子转录动子转录RNARNA中间体中间体而转座而转座 THE-1THE-1(人)(人),Bs1Bs1(玉米)(玉米)RNARNA转录本转录本33端具有端具有polyA polyA 编码反转录编码反转录酶酶 经临近启动经临近启动子而转录子而转录出出RNARNA中间中间体而转座体而转座 F F elementelement(果蝇)(果蝇)LiLi(人),(人),CinCin4 4(玉米)(玉米)第59页,共62页,编辑于2022年,星期二在真核生物的基因中普遍存在着内含子,既然内含子不编码,那么它的生物学意义何在?在长期的进化中为什么它能保留呢?请举例说明。第60页,共62页,编辑于2022年,星期二第61页,共62页,编辑于2022年,星期二第62页,共62页,编辑于2022年,星期二