《篇-医学遗传学基础-第一章人类基因和基因组ppt课件.ppt》由会员分享,可在线阅读,更多相关《篇-医学遗传学基础-第一章人类基因和基因组ppt课件.ppt(74页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第一篇第一篇 医学遗传学基础医学遗传学基础(疾病发生的遗传学机制)(疾病发生的遗传学机制)第一章第一章 人类基因和基因组人类基因和基因组第一节第一节 基因的概念基因的概念lDNA分子的组成分子的组成lDNA分子结构分子结构 第二节第二节 基因的化学本质基因的化学本质第三节第三节 细菌的基因组细菌的基因组l 基因的结构基因的结构l 基因组的组成基因组的组成第四节第四节 基因的生物学特性基因的生物学特性l 遗传信息的储存单位遗传信息的储存单位l 基因的自我复制基因的自我复制 l 基因表达基因表达 l 基因表达的调控基因表达的调控 第五节第五节 人类基因组计划人类基因组计划l 结构基因组学结构基因组
2、学l 后基因组学后基因组学第一节第一节 基因的概念基因的概念 是原核、真核生物以及病毒的是原核、真核生物以及病毒的DNA和和RNA分分子中具有遗传效应的核苷酸序列,是遗传的基本单子中具有遗传效应的核苷酸序列,是遗传的基本单位和突变的单位以及控制性状的功能单位。位和突变的单位以及控制性状的功能单位。生物化学概念:生物化学概念:一段一段DNADNA或或RNARNA顺序,该顺序可以产生顺序,该顺序可以产生或影响某种表型,可以由于突变生成等位基因变异体。或影响某种表型,可以由于突变生成等位基因变异体。遗传学概念:遗传学概念:代表一个遗传的代表一个遗传的功能单位功能单位,同时也是一,同时也是一个个交换单
3、位交换单位和和突变单位突变单位。基因基因 2020世纪世纪5050年代以前,主要从细胞的染色体水平上进行年代以前,主要从细胞的染色体水平上进行研究,属于基因的染色体遗传阶段。研究,属于基因的染色体遗传阶段。20 20世纪世纪5050年代,主要从年代,主要从DNADNA大分子水平上进行研究,属大分子水平上进行研究,属于基因的分子生物学阶段。于基因的分子生物学阶段。20 20世纪世纪8080年代以后,研究基因的功能及其与表型之间年代以后,研究基因的功能及其与表型之间的关系,使基因的研究进入了反向生物学阶段。的关系,使基因的研究进入了反向生物学阶段。基因基因 基因结构研究的历史基因结构研究的历史n基
4、因研究大体的三个阶段:基因研究大体的三个阶段:基因结构研究的历史基因结构研究的历史n从遗传学史的角度看,基因概念大致分以下几个阶段:从遗传学史的角度看,基因概念大致分以下几个阶段:泛基因泛基因(或前基因)(或前基因)孟德尔孟德尔(遗传因子)(遗传因子)摩尔根摩尔根(基因)(基因)顺反子顺反子操纵子操纵子现代基因现代基因 遗传学的奠基人孟德尔遗传学的奠基人孟德尔遗传学的奠基人孟德尔遗传学的奠基人孟德尔(Gregor Johann Mendel 1822Gregor Johann Mendel 182218841884)19世纪世纪60年代初,孟德尔对具有不同形态的豌豆作杂交年代初,孟德尔对具有不
5、同形态的豌豆作杂交实验,在解释实验中每种性状的遗传行为时,用实验,在解释实验中每种性状的遗传行为时,用A代表红花,代表红花,a代表白花,表明生物的某种性状是由遗传因子负责传递的,代表白花,表明生物的某种性状是由遗传因子负责传递的,遗传下来的不是具体的性状,而是遗传因子。遗传因子是颗遗传下来的不是具体的性状,而是遗传因子。遗传因子是颗粒性的,在体细胞内成双存在,在生殖细胞内成单存在。孟粒性的,在体细胞内成双存在,在生殖细胞内成单存在。孟德尔所说的德尔所说的“遗传因子遗传因子”是代表决定某个性状遗传的抽象符是代表决定某个性状遗传的抽象符号。号。基因的两个基本属性:基因的两个基本属性:l 基因是世代
6、相传的;基因是世代相传的;l 基因是决定遗传性表达的。基因是决定遗传性表达的。现在所说的现在所说的“基因是生物体传递遗传信息和表达遗传信基因是生物体传递遗传信息和表达遗传信息的基本物质单位息的基本物质单位”,实际上就是孟德尔所阐明的基因观。,实际上就是孟德尔所阐明的基因观。1926年,摩尔根的巨著年,摩尔根的巨著基因论基因论出版,从而建出版,从而建立了著名的基因学说。立了著名的基因学说。基因是染色体上的实体;基因是染色体上的实体;基因象链珠基因象链珠(bead)一样,孤立地一样,孤立地 呈线状地排列在染色体上;呈线状地排列在染色体上;基因是基因是功能功能突变突变 交换交换“三位一体三位一体”的
7、的(Three in one)最小的最小的 不可分割的不可分割的基本的基本的遗传单位。遗传单位。1957年,本泽尔(年,本泽尔(Seymour Benzer)以)以T4噬噬菌体为材料,在菌体为材料,在DNA分子水平上研究基因内部的精分子水平上研究基因内部的精细结构,提出了顺反子(细结构,提出了顺反子(cistron)概念。)概念。对经典的基因概念的对经典的基因概念的 第一次重要修正与发展第一次重要修正与发展rII47 104 101 103 105 106 51 102 A gene B gene rII of T4 phage including two rII of T4 phage in
8、cluding two rII of T4 phage including two rII of T4 phage including two genesgenesgenesgenes r106 r51 +r106 +r51n 顺反测验 r47 106 +r47 +r106 K菌株 顺反子假说顺反子假说(Theory of cistron)Cistron 是基因的同义词是基因的同义词在一个顺反子内,有若干个突变单位在一个顺反子内,有若干个突变单位 突变子突变子在一个顺反子内,有若干个交换单位在一个顺反子内,有若干个交换单位 交换子交换子基因是一个具有特定功能的,完整的,不可分割基因是一个具有特
9、定功能的,完整的,不可分割的的 最小的遗传单位。最小的遗传单位。three in one one in one基因内可以较低频率发生基因内的重组,交换基因内可以较低频率发生基因内的重组,交换。o one gene one enzyme one gene one peptide one gene one functionLac.OperonLactose操纵子理论操纵子理论 基因功能的表现是若干基因组成的信息表达的整体行为。基因功能的表现是若干基因组成的信息表达的整体行为。I P O Z Y A zya根据其是否具有转录和翻译功能可以把基因分为三类:根据其是否具有转录和翻译功能可以把基因分为三类
10、:编码蛋白质的基因编码蛋白质的基因编码蛋白质的基因编码蛋白质的基因,它具有转录和翻译功能,包括编,它具有转录和翻译功能,包括编码酶和结构蛋白的结构基因以及编码调节蛋白的调节基码酶和结构蛋白的结构基因以及编码调节蛋白的调节基因;因;只有转录功能而没有翻译功能的基因只有转录功能而没有翻译功能的基因只有转录功能而没有翻译功能的基因只有转录功能而没有翻译功能的基因,包括,包括tRNA基基因和因和rRNA基因;基因;不转录的基因不转录的基因不转录的基因不转录的基因,它对基因表达起调节控制作用,包括,它对基因表达起调节控制作用,包括启动子和操纵基因。启动子和操纵基因有时被统称为控启动子和操纵基因。启动子和
11、操纵基因有时被统称为控制基因。制基因。基因主要位于染色体上,还有染色体外遗传物质。基因主要位于染色体上,还有染色体外遗传物质。基因概念的发展基因概念的发展移动基因移动基因 DNA能在有机体的染色体组内从能在有机体的染色体组内从1个地方跳到另一个地方,它个地方跳到另一个地方,它们能从们能从1个位点切除,然后插入同一或不同染色体上的另一个位置。个位点切除,然后插入同一或不同染色体上的另一个位置。移动基因机构简单,由几个促进移位的基因组成。基因的跳动能移动基因机构简单,由几个促进移位的基因组成。基因的跳动能够产生突变和染色体重排,进而影响其他基因的表达。够产生突变和染色体重排,进而影响其他基因的表达
12、。断裂基因断裂基因 真核蛋白质编码基因的核苷酸序列中间插入有与编码无关的真核蛋白质编码基因的核苷酸序列中间插入有与编码无关的DNA间隔区,使间隔区,使1个基因分隔成不连续的若干区段个基因分隔成不连续的若干区段。重叠基因重叠基因 一些噬菌体和动物病毒,不同基因的核苷酸序列有时是可以一些噬菌体和动物病毒,不同基因的核苷酸序列有时是可以共用的。共用的。l内含子内含子(intron)位于基因内部,不编位于基因内部,不编码基因产物的序列,在成码基因产物的序列,在成熟熟mRNA中被切除。中被切除。l外显子外显子(exon)一个基因不包括内含一个基因不包括内含子的任何编码序列,其子的任何编码序列,其mRNA
13、相应区域可翻译成相应区域可翻译成蛋白蛋白。断裂基因断裂基因存在的生物学意义存在的生物学意义 1.有利于遗传的相对稳定有利于遗传的相对稳定 mutation frequency即使错误剪接留下的即使错误剪接留下的intron部分部分 被被mRNA监测系统降解,避免病变和死亡监测系统降解,避免病变和死亡 in intron in exon (剪除)(剪除)(密码)(密码)外显子和内含子中发生突变的外显子和内含子中发生突变的概率是相同的,但是内含子的概率是相同的,但是内含子的突变率总是高于外显子,为什突变率总是高于外显子,为什么?么?2.增加变异机率,增加变异机率,有利于生物的进化有利于生物的进化
14、不对称交换形成不对称交换形成 splitting gene 是生物体产生变异导致进化的重要途径之一是生物体产生变异导致进化的重要途径之一 splitting gene(含有(含有intron)增加了基因的长度增加了基因的长度 增加了基因内的重组交换几率增加了基因内的重组交换几率 有利于形成变异和生物多样性有利于形成变异和生物多样性 对对 intron 不同方式的剪接(选择性剪接),形成不同的基因产物不同方式的剪接(选择性剪接),形成不同的基因产物 (5%isoform protein in mammalian)3.扩大生物体的遗传信息储量扩大生物体的遗传信息储量鼠的两个胰岛素基因珠蛋白豆血红蛋
15、白亚铁血红素结合蛋白质 Heme-binding protein亚铁血红素结合功能域 1977年年Sanger在研究在研究X174时发现的。时发现的。X174是是一种单链一种单链DNA病毒,宿主为病毒,宿主为大肠杆菌,因此,又是噬菌体。大肠杆菌,因此,又是噬菌体。它感染大肠杆菌后共合成它感染大肠杆菌后共合成11个个蛋白质分子,总分子量为蛋白质分子,总分子量为25万万左右,相当于左右,相当于6078个核苷酸个核苷酸所容纳的信息量。而该病毒所容纳的信息量。而该病毒DNA本身只有本身只有5375个核苷酸,个核苷酸,最多能编码最多能编码197kDa蛋白质,蛋白质,实际上编码实际上编码263kDa蛋白质
16、蛋白质。如:如:B和和A,E和和D 其读码结构互不相同其读码结构互不相同-ATG-/-AATGCC-/-ATAACG-/-TAA-A*BATGCCN-NNATAA一个基因完全在另一个基因内部一个基因完全在另一个基因内部 如:如:K和和C TAATGD 终止密码子终止密码子J 起始密码子起始密码子部分重叠部分重叠两个基因共用少数碱基对两个基因共用少数碱基对 如:如:D和和J重叠基因的生物学意义重叠基因的生物学意义 1.1.原核生物进化的经济原则原核生物进化的经济原则 (较小的较小的C C值编码较多的基因信息值编码较多的基因信息)2.2.提高蛋白质的疏水性提高蛋白质的疏水性,以增强生物体自然选择的
17、适应性以增强生物体自然选择的适应性 密码子进化理论认为密码子进化理论认为;NYR多为多为Hydrophobic amino acid,改变蛋白质性能改变蛋白质性能 原始密码子多为原始密码子多为 RNYRNYRNY(A/G N U/C)RNYRNYRNY (N Y R)(N U/C A/G)+1+1移码移码,进化进化 3.3.遗传信息量的估算遗传信息量的估算 突变效应的鉴定突变效应的鉴定 表达调控的理论发展表达调控的理论发展 4.4.丰富和发展了基因的概念丰富和发展了基因的概念 (部分回答部分回答 C=c)C=c)第二节第二节 基因的化学本质基因的化学本质 一、一、DNA分子的组成分子的组成1.
18、DNA1.DNA基本组成单位:脱氧核苷酸;基本组成单位:脱氧核苷酸;2.2.脱氧核苷酸组成:磷酸、脱氧核糖和含氮碱脱氧核苷酸组成:磷酸、脱氧核糖和含氮碱 基;基;一、一、DNA分子的组成分子的组成3.3.四种碱基:腺嘌呤(四种碱基:腺嘌呤(adenine,Aadenine,A)鸟嘌呤(鸟嘌呤(guanine,Gguanine,G)胞嘧啶(胞嘧啶(cytosine,Ccytosine,C)胸腺嘧啶(胸腺嘧啶(thymine,Tthymine,T)一、一、DNA分子的组成分子的组成4.4.四种碱基构成的四种脱氧核苷酸:四种碱基构成的四种脱氧核苷酸:脱氧腺嘌呤核苷酸(脱氧腺嘌呤核苷酸(dAMP,Ad
19、AMP,A)脱氧鸟嘌呤核苷酸(脱氧鸟嘌呤核苷酸(dGMP,GdGMP,G)脱氧胞嘧啶核苷酸(脱氧胞嘧啶核苷酸(dCMP,CdCMP,C)脱氧胸腺嘧啶核苷酸(脱氧胸腺嘧啶核苷酸(dTMP,TdTMP,T)5.5.四种脱氧核苷酸按一定顺序排列成四种脱氧核苷酸按一定顺序排列成DNADNA单链,单链,两个相邻脱氧核苷酸由磷酸二酯键连接。两个相邻脱氧核苷酸由磷酸二酯键连接。一、一、DNA分子的组成分子的组成6.6.每条脱氧核苷酸单链都有每条脱氧核苷酸单链都有3 3端和端和5 5 端。端。7.7.生物的遗传性状以脱氧核苷酸的排列来储存生物的遗传性状以脱氧核苷酸的排列来储存遗传信息。遗传信息。8.8.脱氧核
20、苷酸的排列是脱氧核苷酸的排列是DNADNA遗传的核心。遗传的核心。二、二、DNA分子结构分子结构DNADNA分子的双螺旋结构模型分子的双螺旋结构模型1.DNA1.DNA由两条碱基互补的、反向平行排列的脱氧多核苷由两条碱基互补的、反向平行排列的脱氧多核苷 酸单链组成;酸单链组成;一条是一条是5 5 3 3方向,另一条是方向,另一条是3 3 5 5方向;方向;碱基互补的方式碱基互补的方式:A:A与与T T或或T T与与A A,C C与与G G或或G G与与C C;A A与与T T间由间由2 2个氢键相连,个氢键相连,C C与与G G间由间由3 3个氢键相连。个氢键相连。氢键维持双链横向稳定性,碱基
21、堆积力维持双链纵向稳定性氢键维持双链横向稳定性,碱基堆积力维持双链纵向稳定性。二、二、DNA分子结构分子结构DNADNA分子的双螺旋结构模型分子的双螺旋结构模型2.2.自然情况下,绝大多数自然情况下,绝大多数DNADNA分子的分子的 两条互补链围绕一两条互补链围绕一“主轴主轴”向右向右 盘旋形成双螺旋结构。盘旋形成双螺旋结构。3.3.四种碱基(四种碱基(A A、T T、G G、C C)的排列)的排列 顺序在不同的顺序在不同的DNADNA分子中各不相同,分子中各不相同,蕴含各种生物性状的遗传信息。蕴含各种生物性状的遗传信息。二、二、DNA分子结构分子结构DNADNA分子的双螺旋结构模型分子的双螺
22、旋结构模型4.4.双螺旋表面形成两条凹槽,一面宽而深,称之为大沟双螺旋表面形成两条凹槽,一面宽而深,称之为大沟(major groovemajor groove),另一面狭而浅,称之为小沟(),另一面狭而浅,称之为小沟(minor minor groove groove)。两条沟,对于有特定功能的蛋白质(酶)。两条沟,对于有特定功能的蛋白质(酶)识别并调节识别并调节DNADNA双螺旋结构上的遗传信息非常重要。双螺旋结构上的遗传信息非常重要。二、二、DNA分子结构分子结构DNADNA分子的双螺旋结构模型分子的双螺旋结构模型5.DNA5.DNA分子相对分子质量巨大,碱基对的排列方分子相对分子质量巨
23、大,碱基对的排列方 式多种多样,导致式多种多样,导致DNADNA分子种类繁多。复杂的分子种类繁多。复杂的 DNA DNA分子内蕴藏着生物界无穷无尽的遗传信息,分子内蕴藏着生物界无穷无尽的遗传信息,决定了自然界生命的多样性。决定了自然界生命的多样性。第三节第三节 人类基因和基因人类基因和基因 组的结构特点组的结构特点 人类基因组(人类基因组(human genomehuman genome)是人体所有遗)是人体所有遗传信息的总和。传信息的总和。人类基因组包括两个相对独立而相互关联的人类基因组包括两个相对独立而相互关联的基因组:核基因组(基因组:核基因组(nuclear genomenuclear
24、 genome)和线粒体)和线粒体基因组(基因组(mitochondrial genomemitochondrial genome)。)。一、基因的结构一、基因的结构(一)基因的分类(一)基因的分类 一、基因的结构一、基因的结构(一)基因的分类(一)基因的分类 人类基因组约有人类基因组约有20000-2200020000-22000个基因,与蛋个基因,与蛋白质合成相关的基因序列只占整个基因组序列的白质合成相关的基因序列只占整个基因组序列的1.1%1.1%左右;左右;4%4%为基因调控序列和为基因调控序列和RNARNA基因序列;基因序列;20%20%为内含子、基因非翻译区序列及假基因;为内含子、
25、基因非翻译区序列及假基因;75%75%为基因外序列,为基因外序列,55%55%为重复为重复DNADNA序列。序列。人类基因组中的功能序列可分为四大类:人类基因组中的功能序列可分为四大类:一、基因的结构一、基因的结构(一)基因的分类(一)基因的分类1.1.单一基因(单一基因(solitary genesolitary gene)人的基因中,人的基因中,25%-50%25%-50%的蛋白质基因在单倍的蛋白质基因在单倍体基因组中只有一份,称为单一基因或单一序列体基因组中只有一份,称为单一基因或单一序列(unique sequenceunique sequence)。)。一、基因的结构一、基因的结构(
26、一)基因的分类(一)基因的分类2.2.基因家族(基因家族(gene familygene family)已克隆的许多基因都不完全是单拷贝,有重已克隆的许多基因都不完全是单拷贝,有重复的多拷贝,这一部分基因属于两个或更多个相复的多拷贝,这一部分基因属于两个或更多个相似基因的家族,称为基因家族。似基因的家族,称为基因家族。类同的蛋白质则组成蛋白质家族(类同的蛋白质则组成蛋白质家族(protein protein familyfamily),蛋白质成员可达数百个。蛋白质成员可达数百个。一、基因的结构一、基因的结构(一)基因的分类(一)基因的分类3.3.假基因(假基因(pseudogenepseudo
27、gene)一种畸变基因,核苷酸序列与有功能的正常一种畸变基因,核苷酸序列与有功能的正常基因有很大同源性,但由于突变、缺失或插入以基因有很大同源性,但由于突变、缺失或插入以至不能表达,因而没有功能的基因。至不能表达,因而没有功能的基因。一、基因的结构一、基因的结构(一)基因的分类(一)基因的分类4.4.串联重复基因(串联重复基因(tandem repetitive tandem repetitive sequencesequence)45SrRNA 45SrRNA、5SrRNA5SrRNA、各种、各种tRNAtRNA基因以及蛋白基因以及蛋白质家族中的组蛋白基因是呈串联重复排列的,这质家族中的组蛋
28、白基因是呈串联重复排列的,这类基因称为串联重复基因。类基因称为串联重复基因。一、基因的结构一、基因的结构(二)割裂基因(二)割裂基因(split split genegene)真核生物的结构基因是割裂基因,由编码序真核生物的结构基因是割裂基因,由编码序列(外显子,列(外显子,exonexon)和非编码序列(内含子,)和非编码序列(内含子,intronintron)组成,两者相间排列,不同基因所含内)组成,两者相间排列,不同基因所含内含子数目和大小各不相同。含子数目和大小各不相同。一、基因的结构一、基因的结构(二)割裂基因(二)割裂基因(split split genegene)由于由于mRNA
29、mRNA剪接加工的方式不同,使得编码不同的多剪接加工的方式不同,使得编码不同的多肽链的基因时肽链的基因时外显子和内含子的关系不固定外显子和内含子的关系不固定,这种关系,这种关系产生了基因的差异表达,构成产生了基因的差异表达,构成割裂基因结构上的一个重割裂基因结构上的一个重要特点要特点。一、基因的结构一、基因的结构(二)割裂基因(二)割裂基因(split split genegene)每个割裂基因中第一个外显子的上游和最末一个外显子的下游,每个割裂基因中第一个外显子的上游和最末一个外显子的下游,都有一段不被转录的非编码区称为侧翼序列(都有一段不被转录的非编码区称为侧翼序列(flanking se
30、quenceflanking sequence),),包括启动子、增强子及终止子。包括启动子、增强子及终止子。启动子:位于基因转录起始点上游启动子:位于基因转录起始点上游100100200bp200bp处(范围);处(范围);是是RNARNA聚合酶与模板聚合酶与模板DNADNA(转录因子)互相作用的核苷酸序列或结合区(转录因子)互相作用的核苷酸序列或结合区段,是识别转录起始部位的信号,能启动基因转录段,是识别转录起始部位的信号,能启动基因转录;目前已发现有;目前已发现有三种启动序列:即三种启动序列:即“TATATATA框框“CAATCAAT框框”和和“GCGC框框”。(或称三个。(或称三个DN
31、ADNA序列元件)。序列元件)。增强子:增强子:“增强子增强子”是一个短序列元件,特异性地结合于转录是一个短序列元件,特异性地结合于转录因子,能因子,能增强基因的转录活性增强基因的转录活性,它可以位于转录起始点的上游,也,它可以位于转录起始点的上游,也可以位于下游,与与启动子相距可以位于下游,与与启动子相距1000bp1000bp3000bp3000bp以上,以上,当它被激活当它被激活时,转录活性增强时,转录活性增强200200倍以上。倍以上。一、基因的结构一、基因的结构(二)割裂基因(二)割裂基因(split split genegene)终止子:终止子:“终止子终止子”位于位于3 3非编码
32、区下游,由非编码区下游,由AATAAAAATAAA段反向重段反向重复(回文序列)、(倒位重复)组成,复(回文序列)、(倒位重复)组成,AATAAAAATAAA是是PoolyAPoolyA(多聚腺苷(多聚腺苷酸)附加信号,酸)附加信号,PolyAPolyA构成转录的终止信号构成转录的终止信号,因回文序列转录后形成因回文序列转录后形成发夹结构发夹结构,阻碍阻碍RNARNA聚合酶连续移动,转录终止。聚合酶连续移动,转录终止。En:En:增增强强子子;P1 P1.P2 P2.P3 P3 启启动动子子(TATA TATA 框框、CAAT CAAT 框框、GC GC 框框);E:E:外外显显子子;I:I:
33、内内含含子子;UT:UT:非翻译区;非翻译区;GT-AG:GT-AG:外显子外显子-内含子接头内含子接头 主体部分(编码区)内含子、外显子主体部分(编码区)内含子、外显子侧翼顺序(调控区)启动子(侧翼顺序(调控区)启动子(TATATATA框、框、CAATCAAT框、框、GCGC框)、增强子、终止子框)、增强子、终止子 一、基因的结构一、基因的结构(二)割裂基因(二)割裂基因(split split genegene)割裂基因结构中外显子割裂基因结构中外显子-内含子接头区是高度保守的内含子接头区是高度保守的一致序列,称为一致序列,称为外显子外显子-内含子接头内含子接头,是,是割裂基因结构上割裂基
34、因结构上的又一重要特点的又一重要特点。每个内含子每个内含子5 5 端起始两个碱基是端起始两个碱基是GTGT,3 3端最后两个端最后两个碱基是碱基是AGAG,这种接头形式叫,这种接头形式叫GT-AGGT-AG法则法则。各种真核生物基因的内含子中的接头均相同。各种真核生物基因的内含子中的接头均相同。一、基因的结构一、基因的结构5 5.AGCCGACTATGTCGAAGCTT.AGCCGACTATGTCGAAGCTT.GCTTGACTATAAGACAGCTTGACTATAAGACA3 33 3.TCGGCTGATACAGCTTCTAA.TCGGCTGATACAGCTTCTAA.CGAACTGATAT
35、TCTGTCGAACTGATATTCTGT5 5转录调控区转录调控区 贮存贮存RNARNA或蛋白质结构信息区或蛋白质结构信息区 转录终止区转录终止区 二、基因组的组成二、基因组的组成(一)单拷贝序列(一)单拷贝序列 指在单倍体基因组中只出现一次或数次,指在单倍体基因组中只出现一次或数次,在人类基因组中约占在人类基因组中约占60-65%60-65%;大多数编码蛋;大多数编码蛋白质的结构基因属这一类。白质的结构基因属这一类。又称非重复序列或单一基因,在基因中又称非重复序列或单一基因,在基因中仅有单一拷贝或少数几个拷贝仅有单一拷贝或少数几个拷贝,长度在长度在800-800-1000bp1000bp之
36、间。之间。二、基因组的组成二、基因组的组成(二)重复多拷贝序列(二)重复多拷贝序列 高度重复序列重复频率可达106次,包括反向重复序列、卫星DNA等,约占10-15%;这类DNA由非编码的DNA重复串联排列,分散或局限在基因组的某区域,高度重复,分为:高重序列(串联重复)和反重序列(散在重复)。1.串联重复:在一个基因组中存在大量拷贝的DNA序列,重复的拷贝数106108,散在分布于基因组中,占基因组DNA10%30%,这些序列通常很短,一般在6200bp,因序列短缺乏转录必须的启动子,故没有转录能力,不编码任何Pr,高度重复序列大多集中在异染色质区。二、基因组的组成二、基因组的组成(二)重复
37、多拷贝序列(二)重复多拷贝序列1.串联重复功能 参与复制水平的调节;如反向重复序列常存在于DNA复制起点区的附近,是一些蛋白质的结合位点;参与基因表达的调控;参与染色体配对。2.散在(中度)重复DNA序列和其他可动DNA因子 以不同的量分布于整个基因组的不同部位,在一个基因组中出现102105拷贝的DNA序列,长度为3007000bp,这些DNA序列在长度和拷贝数量上有很大的差异,占整个基因组的2540%,它可分为两类:二、基因组的组成二、基因组的组成(二)重复多拷贝序列(二)重复多拷贝序列2.散在重复DNA序列和其他可动DNA因子短散在重复元件(short interspersed nucl
38、ear elements,SINES)即短分散核元件,占人类基因组的7%,这些间隔的DNA长度300500bp,但拷贝数目可达75万个以上,这些分散核元件常位于基因的非编码区,可能与基因表达的调控有关。长散在重复元件(long interspersed nuclear elements,LINES)即长分散核元件,占人类基因组的5%,长度可达60007000bp,拷贝数目在20-50万个。核元件:指间隔的DNA片段,尤其是指那些中度重复的DNA。第四节第四节 基因的生物学特性基因的生物学特性 一、遗传信息的储存单位一、遗传信息的储存单位(一)遗传密码(一)遗传密码 DNA转录的mRNA链上每3
39、个相邻碱基序列构成一个三联体,每个三联体能编码一种氨基酸,三联体又称三联体密码、遗传密码或密码子,遗传密码是遗传信息的具体表现形式。mRNA链上4种碱基以三联体形式组合成43 3,即64种遗传密码。其中61种为20种aa编码,3种为终止密码。一、遗传信息的储存单位一、遗传信息的储存单位(二)遗传密码的特性(二)遗传密码的特性1.1.通用性通用性:一般情况下病毒、原核生物、真核生物、人类都能通用。2.2.简并性简并性:几个密码编码一种aa。3.3.起始密码和终止密码起始密码和终止密码:有的既可作起始密码,也可编码aa.如AUG既是起始密码又能编码甲硫氨酸。另有UAA、UAG、UGA不编码任何aa
40、,只作终止密码。二、基因的自我复制二、基因的自我复制(一)(一)DNADNA双螺旋结构解旋为两条单股的多核苷酸链双螺旋结构解旋为两条单股的多核苷酸链 基因复制是以DNA复制为基础的,真核生物DNA分子上有多个复制起始点,一个复制起始点所复制的DNA区段为复制单位,称“复制子”。DNA双螺旋分子在解旋酶的作用下解旋、氢链断开、两链分开。两条链根据自身的碱基在细胞核中按互补的原则进行碱基配对,即A=T、T=A、CG、GC,又在连接酶作用下形成一条新多核苷酸链,并与原有的多核苷酸母链形成新的双螺旋结构。二、基因的自我复制二、基因的自我复制(二)(二)DNADNA分子的每一股单链都可作为模板进分子的每
41、一股单链都可作为模板进 行自我复制行自我复制1 1、互补性、互补性:即子链与模板链碱基互补。2 2、半保留性、半保留性:DNA分子以两条链各为模板合成新DNA的过程,新合成DNA双链中保留了一条原有DNA分子的旧链,故称“半保留复制”。3 3、反向平行性、反向平行性:即53 35。4 4、不对称性、不对称性:DNA的复制是不对称的,即以 35复制时,子链是连续的,而53复制时,子链是不连续的,首先在引发体的起始引发下合成大量DNA小片段,称冈崎片段,冈崎片段在DNA连接酶作用下连接成一条长链。5 5、不连续性、不连续性:即复制子。三、基因表达三、基因表达(一)转录(一)转录 在在RNARNA聚
42、合酶催化下,聚合酶催化下,DNADNA以一条链为模板,以以一条链为模板,以ATPATP、CTPCTP、GTPGTP、UTPUTP为前体为前体RNARNA合成合成RNARNA的过程称的过程称“转录转录”;或:;或:DNADNA将遗传信息传递到将遗传信息传递到RNARNA的过程。的过程。1.1.转录过程转录过程 转录在细胞核中进行,转录在细胞核中进行,5 53 3方向转录;一般包括起始、延伸方向转录;一般包括起始、延伸和终止和终止3 3个连续步骤;转录要在启动子和个连续步骤;转录要在启动子和RNARNA聚合酶的作用下从转录起聚合酶的作用下从转录起始点开始,以碱基因互补的方式合成一个始点开始,以碱基
43、因互补的方式合成一个RNARNA。这种新合成的。这种新合成的RNARNA称核称核内异质内异质RNARNA或不均一核或不均一核RNARNA(hnRNAhnRNA)。)。DNADNA中中3 35 5称有义链(模板称有义链(模板链)或链)或WatsonWatson链,另一条则称编码链或链,另一条则称编码链或CriekCriek链或称反义链。链或称反义链。RNARNA聚合聚合酶酶在在DNADNA模板上移动到达终止信号时,模板上移动到达终止信号时,RNARNA合成停止。合成停止。三、基因表达三、基因表达(一)转录(一)转录2.2.转录产物的加工和修饰转录产物的加工和修饰 加工一般包括戴帽、加尾和剪接。加
44、工一般包括戴帽、加尾和剪接。(1)1)戴帽(加帽):即在初级转录物戴帽(加帽):即在初级转录物5 5端加上一个甲基化核苷酸,端加上一个甲基化核苷酸,即加上即加上“7-7-甲基鸟嘌呤核苷酸甲基鸟嘌呤核苷酸”帽,封闭了帽,封闭了3RNA3RNA的的5 5端称加帽端称加帽。加帽的功能加帽的功能:保护保护RNARNA转录本避免外切核苷酸酶转录本避免外切核苷酸酶5 53 3消化消化;有利于有利于RNARNA从从细胞核运到细胞质细胞核运到细胞质;便于便于RNARNA剪接剪接;有助于细胞质中的核糖体识别有助于细胞质中的核糖体识别mRNAmRNA。三、基因表达三、基因表达(一)转录(一)转录2.2.转录产物的
45、加工和修饰转录产物的加工和修饰 加工一般包括戴帽、加尾和剪接。加工一般包括戴帽、加尾和剪接。(2 2)加尾:即在初级转录物加尾:即在初级转录物3 3端加上端加上“多聚腺苷酸多聚腺苷酸”尾,尾,也称也称POlyAPOlyA化。化。加尾的作用:加尾的作用:促使促使mRNAmRNA从核进入质从核进入质;稳定稳定mRNAmRNA分子分子;有利于核糖体识别有利于核糖体识别mRNAmRNA。三、基因表达三、基因表达(一)转录(一)转录2.2.转录产物的加工和修饰转录产物的加工和修饰 加工一般包括戴帽、加尾和剪接。加工一般包括戴帽、加尾和剪接。(3 3)剪接)剪接:转录是把基因的外显子和内含子转录成转录是把
46、基因的外显子和内含子转录成RNARNA序列,这个原始序列,这个原始RNARNA转录本称为异质转录本称为异质RNARNA(hnRNAhnRNA)或称为不均一核)或称为不均一核RNARNA。在剪接酶的作用。在剪接酶的作用下,把内含子非编码序列切除,再将外显子编码序列由连接酶逐段连接下,把内含子非编码序列切除,再将外显子编码序列由连接酶逐段连接起来,形成成熟的起来,形成成熟的mRNAmRNA分子,称分子,称“剪接剪接”。每个内含子的每个内含子的5 5端起始处有端起始处有GTGT序列,序列,3 3端尾部有端尾部有AGAG序列,这两个序列,这两个序列为高度保守的一致序列,它们是酶切和拚接的信号。序列为高
47、度保守的一致序列,它们是酶切和拚接的信号。tRNA tRNA、rRNA rRNA 的转录最后也要经过相应的加工和修饰过程,才具有的转录最后也要经过相应的加工和修饰过程,才具有功能。功能。三、基因表达三、基因表达(二)翻译(二)翻译 以mRNA为模板指导蛋白质合成的过程(三种RNA的作用):1.mRNA携带遗传信息,作为Pr合成的模板。2.tRNA转运活化的aa并识别mRNA分子上的遗传密码。3.rRNA与Pr结合形成核蛋白体,作为Pr合成的场所,把各种特定的aa连接成多肽链。三、基因表达三、基因表达(三)(三)RNARNA编辑及其意义编辑及其意义1.RNA编辑(RNA editing)(1)U
48、的加入或删除;(2)CU,AG或GA的RNA碱基转换;(3)CG,GC或UA的碱基颠换。2.RNA编辑的生物学意义(1)经编辑的mRNA具有翻译活性;(2)使该mRNA能被通读;(3)在一些转录物5末端造成起始密码子AUG,调节翻译活性;(4)RNA编辑与生物进化有关;(5)RNA编辑不偏离中心法则,信息源于DNA。四、基因表达的调控四、基因表达的调控(一)转录前调控(一)转录前调控 染色质螺旋化程度与基因转录活性有关,疏松的常染色质可进行转录,异固缩的异染色质由于DNA螺旋化阻碍RNA聚合酶作用而抑制了转录,也就是组蛋白乙酰化和DNA甲基化的关系。染色质中的组蛋白能非特异性地非组蛋白则能特异
49、性地解除组蛋白的抑制作用而开始转录。四、基因表达的调控四、基因表达的调控(二)转录水平调控(二)转录水平调控1.顺式作用元件和转录因子 顺式作用元件:是指存在于基因内的那些参与转录调控的DNA序列,包括启动子、增强子等。启动子中有一些保守序列能与转录因子特异性结合;调节基因的转录,这些元件称“顺式作用元件”,功能仅限于5端侧翼序列TATA框、CAAT框。也即启动与转录因子结合才能进行转录。四、基因表达的调控四、基因表达的调控(二)转录水平调控(二)转录水平调控2.反式作用因子(元件)和转录因子 真核细胞中的RNA聚合酶本身不能启动转录,必须有许多转录因子特异结合在基因上游的顺式作用元件;激活R
50、NA聚合酶,从转录起始点开始合成RNA。反式作用因子:是指能够与顺式作用元件结合,参与转录调控的Pr分子。四、基因表达的调控四、基因表达的调控(二)转录水平调控(二)转录水平调控反式作用因子又称“转录因子”,转录因子根据与DNA结合的结构域分为:(1)螺旋转角螺旋蛋白质(2)锌指蛋白(3)亮氨酸拉链蛋白(4)螺旋环螺旋蛋白 不同RNA聚合酶催化转录的RNA不一样:RNA聚合酶催化转录rRNA;RNA聚合酶催化转录mRNA;RNA聚合酶催化转录tRNA和5srRN。四、基因表达的调控四、基因表达的调控(三)转录后调控(三)转录后调控 即hnRNA加工成成熟RNA的过程。(四)翻译后调控(四)翻译