《基因工程的理论基础与基本技术.ppt》由会员分享,可在线阅读,更多相关《基因工程的理论基础与基本技术.ppt(48页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第二章第二章 基因工程的理论基础与基本技术基因工程的理论基础与基本技术第一节第一节 基因工程的理论基础基因工程的理论基础(一)原核生物的基因结构特点(一)原核生物的基因结构特点1.操纵子结构 操纵子(Operon),由几个功能相关的结构基因由几个功能相关的结构基因成簇排列而组成的一个基因表达的协同单位成簇排列而组成的一个基因表达的协同单位(coordinatedunitecoordinatedunite),称为操纵子。),称为操纵子。一基因结构特点调节基因调节基因启动子启动子操纵基因操纵基因结构基因结构基因大肠杆菌乳糖操纵子 色氨酸操纵子 2.原核细胞mRNA的特征(1)半衰期短(2)多顺反子
2、形式(3)存在SD序列 原核生物中起始密码子AUG上游712个核苷酸序列因其与16SrRNA3末端反向互补而被认为在核糖体-mRNA的结合过程中起作用。(4)起始密码子常为AUG(有时GUG,甚至UUG)。3.原核细胞基因的终止子 根据对细菌和噬菌体DNA模板上的终止信号的分析,发现它们具有共同的结构特征:终止点上游存在一个富含GC碱基的二重对称区,由这段DNA转录产生的RNA容易形成发卡式结构;在终止点前面有一段由48个A组成的序列,因此转录产物的3端为寡聚U。UUUUUUUUUUUURNA(二)真核生物基因的结构特点(二)真核生物基因的结构特点 1.真核生物基因的不连续性 断裂基因(int
3、erruptedgene)内含子内含子 是一个基因中非编码DNA片段,它分开相邻的外显子。外显子外显子 是一个基因中编码蛋白序列。严格地说,外显子是指保留在初级mRNA中不被剪切掉的区域,包括5非翻译区(5UTR)、编码序列和3非翻译区(3 UTR)。外显子外显子-内含子连接区内含子连接区 是指外显子和内含子的交界,又称边界序列。GT-AGGT-AG法则法则序列分析表明,几乎每个内含子5端起始的两个碱基都是GT,3端最后两个碱基总是AG,由于这两个碱基的高度保守性和存在的广泛性,有人把它称为GT-AG法则,即:5 GT AG 3。卫星卫星DNA DNA 真核生物基因组中高度重复的DNA,有一些
4、202030bp30bp的极短序列,且以数千个拷贝的串连方式排列,这种序列称为卫星DNA。2.卫星DNA在染色体DNA片段的氯化铯密度梯度离心中,由于浮力密度的不同,这种重复序列在主带DNA附近出现的卫星带,因此称之为卫星DNA。3.真核生物mRNA的特征(1)5端的帽子结构 几乎全部的真核mRNA端都具“帽子”结构。虽然真核生物的mRNA的转录以嘌呤核苷酸三磷酸(pppAG或pppG)领头,但在5端的一个核苷酸总是7-甲基鸟核苷三磷酸(m7GpppAGpNp)。mRNA5端的这种结构称为帽子帽子(cap)。不同真核生物的mRNA具有不同的帽子。(1)有助于有助于mRNA越过核膜,进入胞质;越
5、过核膜,进入胞质;(2)保护保护5不被核酶降解;不被核酶降解;(3)翻译时供翻译时供IF(起始因子)和核糖体(起始因子)和核糖体识别,是翻译所必需的。识别,是翻译所必需的。(2)3末端Poly(A)尾巴除了组蛋白以外,真核生物mRNA3末端都有由40200个A组成的Poly(A)尾巴。Poly(A)尾不是由DNA编码的,而是转录后的前体mRNA以ATP为前体,由RNA末端腺苷酸转移酶,即Ploy(A)聚合酶催化聚合到3末端。mRNA刚从细胞核进入细胞质时,其多聚刚从细胞核进入细胞质时,其多聚(A)尾巴一般比较长,尾巴一般比较长,随着随着mRNA在细胞质内逗留时间延长,多聚在细胞质内逗留时间延长
6、,多聚(A)逐渐变短消失,逐渐变短消失,mRNA进入降解过程。进入降解过程。它可促进核糖体的有效循环。它可促进核糖体的有效循环。是是mRNA由细胞核进入细胞质所必需的形式;由细胞核进入细胞质所必需的形式;它大大提高了它大大提高了mRNA在细胞质中的稳定性。在细胞质中的稳定性。Poly(A)尾巴有三个方面的功能:寡聚(寡聚(dTdT)-纤维素柱层析法纤维素柱层析法常规方法常规方法RNA(RNA(高盐缓冲液高盐缓冲液)寡聚(寡聚(dTdT)纤维素柱)纤维素柱低盐溶液和蒸馏水低盐溶液和蒸馏水洗脱洗脱较高纯度的较高纯度的mRNAmRNA加样加样结合结合DynabeadsOligo(dT)25是一种直径
7、为的均一的、超顺磁的微球体,其表面的5连接键共价结合了由25个脱氧核糖核苷组成的长链。mRNA磁珠分离法二从DNA到蛋白质(一)中心法则(一)中心法则19701970年年特明特明(H.M.Temin)(H.M.Temin)以在劳斯肉瘤病毒以在劳斯肉瘤病毒内发现逆转录酶这一成就进一步发展和完善内发现逆转录酶这一成就进一步发展和完善了了“中心法则中心法则”。(二)基因表达(二)基因表达从DNA到蛋白质的过程称为基因表达。DNARNA转录翻译蛋白质原核生物和真核生物比较1.启动子聚合酶原核生物真核生物RNA聚合酶仅一种RNA聚合酶有三种RNARNA聚合酶聚合酶大部分大部分rRNArRNARNARNA
8、聚合酶聚合酶mRNAmRNA和和snRNAsnRNARNARNA聚合酶聚合酶tRNAtRNA和和5sRNA5sRNA全酶的组成是2 3.表达过程原核生物真核生物无细胞核,转录和翻译几乎同时进行,基因表达的调控主要发生在转录水平。有细胞核,转录在细胞核中,翻译在细胞质中,并且转录和翻译后都有加工过程,基因表达的调控可以发生在各种不同水平。4.表达的调控(1)真核生物的表达调控信号转导转录因子信号分子受体分子离子通道第二信使分子蛋白激酶或磷酸酯酶活性转录因子基因表达(2)原核生物的表达调控代谢物对基因活性的调节 可诱导调节可诱导调节是指一些基因在特殊的代谢物或化是指一些基因在特殊的代谢物或化合物的
9、作用下,由原来关闭的状态转变为工作合物的作用下,由原来关闭的状态转变为工作状态,即在某些物质的诱导下使基因活化。状态,即在某些物质的诱导下使基因活化。可阻遏调节可阻遏调节中的基因平时都是开启的,处在产中的基因平时都是开启的,处在产生蛋白质和酶的工作过程中,但由于一些特殊生蛋白质和酶的工作过程中,但由于一些特殊代谢物或化合物的积累将其关闭,阻遏了基因代谢物或化合物的积累将其关闭,阻遏了基因的表达,所以称为可阻遏基因。的表达,所以称为可阻遏基因。弱化因子对基因活性的影响 降解物对基因活性的调节 添加葡萄糖添加葡萄糖能量得到满足能量得到满足细菌的腺苷酸环化酶细菌的腺苷酸环化酶抑制抑制环腺苷酸环腺苷酸
10、(cMAP)(cMAP)cAMPcAMP受体蛋白受体蛋白调控的基因就不表达调控的基因就不表达细菌的应急反应 氨基酸饥饿 空载tRNA 鸟苷四磷酸(ppGpp)鸟苷五磷酸(pppGpp)关闭一些基因的表达开启氨基酸合成基因的表达生产各种RNA、糖、脂肪和蛋白质在内的几乎全部生物化学反应过程均被停止 环腺苷酸受体蛋白对转录的调控 葡萄糖缺乏葡萄糖缺乏cAMPcAMP合成合成cAMPcAMP受体蛋白受体蛋白促进促进RNARNA聚合聚合酶结合一些基酶结合一些基因的启动子因的启动子抑制抑制RNARNA聚合聚合酶结合一些基酶结合一些基因的启动子因的启动子总结基因工程操作中应注意的真核生物基因工程操作中应注
11、意的真核生物与原核生物的差异与原核生物的差异1.1.基因结构的差异基因结构的差异2.2.启动子和启动子和RNARNA聚合酶的差异聚合酶的差异3.3.蛋白质的翻译后修饰加工(前体切割、二硫键、蛋白质的翻译后修饰加工(前体切割、二硫键、糖基化、甲基化、羰基化、磷酸化、乙酰化、硫糖基化、甲基化、羰基化、磷酸化、乙酰化、硫酸化、丙烯酸化、豆冠酸化、软脂化)酸化、丙烯酸化、豆冠酸化、软脂化)4.4.基因表达的调节(表达量)基因表达的调节(表达量)5.5.载体的差异载体的差异6.6.蛋白质的纯化方便蛋白质的纯化方便1 1遗传密码与信息流遗传密码与信息流储存在储存在DNADNA上的遗传信息通过上的遗传信息通
12、过mRNAmRNA传递给传递给蛋白质,蛋白质,mRNAmRNA与蛋白质之间的联系是通过遗传与蛋白质之间的联系是通过遗传密码的破译来实现的。密码的破译来实现的。mRNAmRNA上每上每3 3个核苷酸翻个核苷酸翻译成蛋白质多肽链上的一个氨基酸,这译成蛋白质多肽链上的一个氨基酸,这3 3个核苷个核苷酸就称为密码子,也叫三联子密码。蛋白质是通酸就称为密码子,也叫三联子密码。蛋白质是通过遗传信息流由基因控制的。过遗传信息流由基因控制的。三基因研究进展2 2结构基因和调节基因结构基因和调节基因结构基因结构基因(structuralgene)(structuralgene)是可以转录成为各种是可以转录成为各
13、种RNA(RNA(如如rRNArRNA、tRNAtRNA、snRNA)snRNA)直接行使功能,或者直接行使功能,或者转录成信使转录成信使RNA(mRNA)RNA(mRNA)然后翻译成多肽链,最终形然后翻译成多肽链,最终形成各种功能蛋白质和酶。成各种功能蛋白质和酶。从广义上讲,任何一种能够调节或限制其他基因从广义上讲,任何一种能够调节或限制其他基因活性的基因都可叫做活性的基因都可叫做调节基因调节基因(regulatorygene)(regulatorygene),一,一般情况下则是指基因产物参与调节别的基因活性的般情况下则是指基因产物参与调节别的基因活性的基因基因(如阻遏基因等如阻遏基因等)。
14、首先转录成。首先转录成mRNAmRNA,然后由,然后由mRNAmRNA翻译成阻遏蛋白质或激活蛋白质,通常也称为翻译成阻遏蛋白质或激活蛋白质,通常也称为转录因子转录因子或反式作用因子。它们通常结合到结构基或反式作用因子。它们通常结合到结构基因的非编码区的顺式元件上起调控作用。因的非编码区的顺式元件上起调控作用。3管家基因和奢侈基因具有相同遗传信息的个体细胞间其所利用的基因并不相同,有的基因活动是维持细胞基本代谢所必需的,而有的基因则在一些分化细胞或受到外界刺激的细胞中活动。前者称为管家基因(house-keepinggene),如编码核糖体蛋白、线粒体蛋白、糖酵解酶等的基因;而后者被称为奢侈基因
15、(1uxurygene),4 4移动基因移动基因19671967年在大肠埃细菌的乳糖操作子的研究中第一次发现年在大肠埃细菌的乳糖操作子的研究中第一次发现了称为了称为插入序列插入序列(insertionsequence(insertionsequence,IS)IS)的转座因子。的转座因子。直至直至19801980年夏皮罗年夏皮罗(Shapiro)(Shapiro)等人证实了可移位的遗传基等人证实了可移位的遗传基因存在,说明某些基因具有移动性。因存在,说明某些基因具有移动性。转座子转座子也称易位子,也称易位子,是由两个重复顺序夹着一个或多个结构基因组成。有的是由两个重复顺序夹着一个或多个结构基因
16、组成。有的转座子的重复序列就是转座子的重复序列就是ISIS。转座子也和。转座子也和ISIS一样,能从一个一样,能从一个位点转座到另一个位点,或从一个复制子转座到另一个位点转座到另一个位点,或从一个复制子转座到另一个复制子。转座子属于可移动的遗传因子复制子。转座子属于可移动的遗传因子移动基因。除移动基因。除了转座因子外,病毒和质粒都是染色体外的可以移动的了转座因子外,病毒和质粒都是染色体外的可以移动的遗传物质,都必须依赖宿主而复制。遗传物质,都必须依赖宿主而复制。5 5重叠基因重叠基因核苷酸序列是彼此重叠的两个基因称为核苷酸序列是彼此重叠的两个基因称为重叠基因重叠基因(overlappingge
17、nes)(overlappinggenes)或镶嵌基因或镶嵌基因(nestedgenes)(nestedgenes)。6假基因假基因是多基因家族中的成员,因其碱基顺序发生某些突变而失去功能,不能表达或表达异常,生成无生物活性的多肽。假基因DNA顺序可在相应基因名称之前加表示,如珠蛋白基因家族中1与功能性2基因同源,1有3个碱基被取代,其中密码子6的GAGTAG(谷氨酸终止密码)发生无义突变。例如,在珠蛋白、免疫球蛋白、组织相容性抗原例如,在珠蛋白、免疫球蛋白、组织相容性抗原(histocompatibi1ityantigen)(histocompatibi1ityantigen)以及肌动蛋白和
18、微管以及肌动蛋白和微管蛋白等基因家族蛋白等基因家族(genefamily)(genefamily)中,都存在着这样的中,都存在着这样的功能失活的假基因。功能失活的假基因。(1)重复的假基因许多假基因都是同“亲本基因”(Parental8ene)连锁的,而且同其编码区及侧翼序列的DNA具有很高的同源佳。可见产生此种类型的假基因拷贝的一种可能的机理是,由含有“亲本基因”的染色体区段串联重复形成,故称之为重复的假基因。珠蛋白基因家族中的假基因即属于这一种类型。(2)加工的假基因除了重复的假基因外在真核生物的染色体基因组中还存在着一类加工的假基因(processedpseudogene)。这类假基因没
19、有与“亲本基因”连锁,而且其结构是同转录本而非“亲本基因”类似。例如,它们都没有启动子和间隔子,但在基因的3末端则都有一段延伸的腺嘌呤短序列,恰似mRNA分子3末端的poly(A)尾巴。这些特征表明,此类假基因很可能是来自加工的RNA之DNA拷贝,因此称之为加工的假基因。7 7串联基因簇串联基因簇中度重复中度重复DNADNA有许多类型的重复序列组成。多重有许多类型的重复序列组成。多重复序列组成的基因簇在重复区域的下游出现,这些通复序列组成的基因簇在重复区域的下游出现,这些通常是其产物需求量很高的基因,常是其产物需求量很高的基因,rDNA(rDNA(编码编码rRNA)rRNA)就是就是其中一例。
20、编码其中一例。编码18S18S、和、和28SrRNA28SrRNA的的45S45S前体的基因就前体的基因就有约有约10101000010000个拷贝的重复序列,其拷贝数因物种而个拷贝的重复序列,其拷贝数因物种而异。人类基因组中异。人类基因组中45S45S基因在基因在5 5个不同的染色体上都有个不同的染色体上都有排列,每一排列包含约排列,每一排列包含约4040个拷贝。在分裂间期这些区个拷贝。在分裂间期这些区域都处于核仁区,核仁是细胞核中的致密区域,是域都处于核仁区,核仁是细胞核中的致密区域,是rRNArRNA合成和修饰的工厂。另一个串联基因簇的例子是合成和修饰的工厂。另一个串联基因簇的例子是组蛋
21、白基因,其产物在组蛋白基因,其产物在S S期大量产生,期大量产生,5 5种种组蛋白基因组蛋白基因在一个基因簇,有的可直接重复达数百次。在一个基因簇,有的可直接重复达数百次。8基因组基因组(genome)是1924年提出的,是指一个生物体、细胞器或病毒的全部基因。原核生物基因组仅由一条环状的双链DNA分子组成,含有一个复制起点,它的基因组就是它的整个染色体。但对于二倍体的高等生物,能维持配子体正常功能的最低数目的一套染色体构成的一个基因组。对于植物细胞而言,则有3个基因组,即染色体基因组(核基因组)、线粒体基因组和叶绿体基因组。(1)原核生物基因组的特点原核生物基因组的特点包括:原核生物基因组的
22、特点包括:具有操纵子结构;具有操纵子结构;编码序列在基因组中约占编码序列在基因组中约占5050,远大于真核基因,远大于真核基因组,但又小于病毒基因组,编码顺序不重叠,其转组,但又小于病毒基因组,编码顺序不重叠,其转录产物多为多顺反子结构;录产物多为多顺反子结构;多顺反子结构且无内含子,是连续的,因此转录多顺反子结构且无内含子,是连续的,因此转录后不需要剪切;后不需要剪切;基因组中重复序列很少,其结构基因多为单拷贝,基因组中重复序列很少,其结构基因多为单拷贝,只有编码只有编码rRNArRNA的基因往往是多拷贝的,有利于核糖的基因往往是多拷贝的,有利于核糖体的快速组装;体的快速组装;基因组中存在可
23、移动的基因组中存在可移动的DNADNA序列,包括插入序列序列,包括插入序列和转座子。和转座子。(2)(2)真核生物基因组的特点真核生物基因组的特点每一种真核生物都有一定的染色体数目,除了配子每一种真核生物都有一定的染色体数目,除了配子(精子和卵子精子和卵子)为单倍体外,体细胞一般为双倍体,而原核生物的基因组则是单为单倍体外,体细胞一般为双倍体,而原核生物的基因组则是单拷贝的;拷贝的;真核生物的基因组远远大于原核生物的基因组,结构复杂,基真核生物的基因组远远大于原核生物的基因组,结构复杂,基因数庞大,具有很多复制起点,每个复制子大小不一;因数庞大,具有很多复制起点,每个复制子大小不一;真核生物都
24、有结构基因与相关的调控区组成,转录产物为单顺真核生物都有结构基因与相关的调控区组成,转录产物为单顺反子反子(monocistron)(monocistron),即一分子,即一分子mRNAmRNA只能翻译成一种蛋白;只能翻译成一种蛋白;大量重复顺序的存在是真核生物基因组的重要特点;大量重复顺序的存在是真核生物基因组的重要特点;真核生物基因组内非编码的顺序占真核生物基因组内非编码的顺序占9090以上。以上。大多数真核生物的结构基因具有内含子结构,是断裂基因。大多数真核生物的结构基因具有内含子结构,是断裂基因。有基因家族,来自同一个祖先基因的复制和变异、功能相关的有基因家族,来自同一个祖先基因的复制和变异、功能相关的基因构成各种基因家族,可以串联在一起,亦可相距很远,但即基因构成各种基因家族,可以串联在一起,亦可相距很远,但即使串联在一起的基因也是分别转录的,具有多重性、序列同源性、使串联在一起的基因也是分别转录的,具有多重性、序列同源性、基因表性的相似性等特点。基因表性的相似性等特点。