《基因工程10基因组研究技术.ppt》由会员分享,可在线阅读,更多相关《基因工程10基因组研究技术.ppt(33页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第十二章第十二章基因基因组研究技研究技术基因基因组研究技研究技术的核心内容:从不同的核心内容:从不同层次上次上对基因基因组全部或某一区段全部或某一区段遗传信息的有序性排列方式以及信息的有序性排列方式以及它它们对应功能的揭示。功能的揭示。第一第一节基因基因组遗传图谱的构建的构建遗传作作图(geneticmapping):):对某个未知真核生某个未知真核生物基因物基因组中的中的遗传信息(或是控制某个性状的基因)信息(或是控制某个性状的基因)在染色体上的位置和分布状况在染色体上的位置和分布状况进行初步确定。它是行初步确定。它是采用采用遗传学分析方法将基因或其他学分析方法将基因或其他DNA序列序列标定
2、在定在染色体上使之成染色体上使之成为一条条有一条条有标识的的“公路公路”。经典典遗传图谱人人们把把单倍体配子所有染色体上的全部基因称倍体配子所有染色体上的全部基因称为一一个基因个基因组。基因。基因组内每条染色体上的内每条染色体上的连锁基因称基因称为一个一个连锁群。群。绘制制遗传图谱就是要就是要进行每条染行每条染色体上基因座色体上基因座位的位的顺序和距离的确定,即主要通序和距离的确定,即主要通过家系分析,家系分析,对不同不同性状之性状之间、性状与、性状与标记之之间、标记与与标记之之间的的连锁遗传频率率进行行计算,最算,最终绘制制遗传连锁图。人人类遗传图谱包括女性一种配子的包括女性一种配子的23条
3、染色体条染色体(记作作23,X)和男性两种配子的和男性两种配子的23条染色体条染色体(23,X)、(23,Y)上的所有基因位点。上的所有基因位点。现代代遗传图谱70年代年代发展起来的展起来的DNA重重组技技术、DNA克隆技克隆技术和和DNA探探针技技术无疑无疑为拓展拓展遗传图谱的构建途径的构建途径创造了技造了技术条件,也使人条件,也使人类基因定基因定位的方法从位的方法从细胞及染色体水平胞及染色体水平过渡到分子水平。渡到分子水平。DNA水平的多水平的多态性性标记位点作位点作为绘制制现代代遗传图谱的主要界的主要界标,大大提高大大提高图谱的的精确度、准确性。精确度、准确性。遗传图谱的的绘制也因此制也
4、因此进入了入了一个一个崭新的新的时代。代。现代代遗传图谱的概念是由的概念是由BotsteinD等等(1980)首先提出的,在此基首先提出的,在此基础上,限制性片段上,限制性片段长度多度多态性性RFLP作作为遗传图谱的第一代的第一代崭新新标记得以得以问世世。遗传图谱的第二代的第二代标记位点是大量的可位点是大量的可变数量串数量串联重复(重复(VNTR),包括微、小包括微、小卫星星(MS)或短串或短串联重复重复(STR或或SSLP)。第三代第三代标记是位点极其丰富的是位点极其丰富的单核苷酸多核苷酸多态性性(SNP)。一、一、遗传作作图标记凡是位于染色体上易于凡是位于染色体上易于检测识别、在不同个体之
5、、在不同个体之间存在存在变异而且可以异而且可以稳定定遗传的位点都可以作的位点都可以作为遗传作作图的的标记。形形态标记分子分子标记遗传作作图标记 形形态标记在在经典典遗传学中,每个相学中,每个相对性状都由一个不同的等位性状都由一个不同的等位基因(基因(allele)控制。但)控制。但这些可些可见的表型性状十分有限,的表型性状十分有限,当多个基因影响同一个性状当多个基因影响同一个性状时,精,精细的的遗传作作图分析分析则陷入困境。因此,要构建高分辨率的陷入困境。因此,要构建高分辨率的遗传图,就必,就必须有数量极其丰富的有数量极其丰富的遗传标记。每一段具有每一段具有专一一遗传性状和功能的性状和功能的D
6、NA被称被称为基因。一基因。一对染染色体中两条染色色体中两条染色单体上相同位置的体上相同位置的DNA片段,就是一片段,就是一对等位等位基因基因。每。每对等位基因的性状有等位基因的性状有显性和性和隐性之分。性之分。拟等位基因等位基因(pseudoalleles):表型效:表型效应相似相似,功能密切相关功能密切相关,在在染色体上的位置又染色体上的位置又紧密密连锁的基因。它的基因。它们象是等位基因象是等位基因,而而实际不是等位基因。不是等位基因。分子分子遗传标记(DNA标记)凡是凡是满足足遗传标记特征的一段特征的一段DNA序列都可以被序列都可以被发展成展成为DNA标记,DNA标记所在的所在的遗传位点
7、必位点必须有不同等位基因,有不同等位基因,特定个体相特定个体相应的基因型可以通的基因型可以通过实验手段很容易手段很容易检测出来。出来。由于由于DNA标记类型丰富,数量众多,因而已型丰富,数量众多,因而已经成成为遗传作作图的主要工具。的主要工具。分子分子遗传标记是指利用分子生物学的方法来区分不同的个体是指利用分子生物学的方法来区分不同的个体或群体或群体,并且可以并且可以稳定定遗传的物的物质或性状或性状,是生物个体或群体是生物个体或群体间遗传差异的客差异的客观表征。表征。广广义的分子的分子标记是指可是指可遗传的并可的并可检测的的DNA序列或蛋白序列或蛋白质。限制性片段限制性片段长度多度多态性性(r
8、estrictionfragmentlengthpolymorphism,RFLP)定定义:就是用:就是用限制性内切限制性内切酶降解从生物中提取的降解从生物中提取的总DNA,经凝胶凝胶电泳分离泳分离这些降解的小片段,再通些降解的小片段,再通过southern印迹印迹转移到移到滤膜上,膜上,然后用放射性然后用放射性标记的探的探针与与滤膜上的膜上的DNA杂交,洗去多余的交,洗去多余的杂交交探探针,永久性,永久性滤膜膜经放射性自放射性自显影就可影就可发现与探与探针杂交的交的DNA限限制性片段。不同的限制性内切制性片段。不同的限制性内切酶,不同来源的,不同来源的DNA及及标记的探的探针就会有不同的就会
9、有不同的结果果组合,利用合,利用这些不同的些不同的组合就可以构建合就可以构建RFLP分子分子标记图谱。简单地地说就是就是DNA经限制性限制性酶切后切后产生的生的DNA片片段段组成状成状态,涉及片段的多少和大小。,涉及片段的多少和大小。对不同的物种来不同的物种来说,相当,相当于形成了由于形成了由DNA片段多片段多态性性组成的指成的指纹。RFLP是第一种被用于是第一种被用于作作图研究的研究的DNA标记。用用RFLP进行基因定位原理:行基因定位原理:EcoRI例:例:GAATTC切点减少切点减少GAGTTCCTTAAG切点增加切点增加CTCAAGmRNA:GAAGAG 谷谷aa谷谷aa优点:点:高效
10、、可靠、可在一个反高效、可靠、可在一个反应内内检测大量的限制性片段;大量的限制性片段;缺点:缺点:需用同位素或非同位素需用同位素或非同位素标记引物,引物,较费时、耗材而且、耗材而且单个个探探针位点少,位点少,鉴别效率不高。效率不高。ABAB限制性内切酶位点与放射性探针结合部位限制性内切酶酶切后;电泳分离DNA片段;转移至硝酸纤维素薄膜;与放射性探针杂交,分析阳性条带简单序列序列长度多度多态性性(simplesequencelengthpolymorphism,SSLP)产生于重复生于重复顺序的可序的可变排列,同一位点重复排列,同一位点重复顺序的重复次数序的重复次数不同表不同表现出序列的出序列的
11、长度度变化。化。小小卫星序列:星序列:重复重复单位的位的长度度为数十个核苷酸。数十个核苷酸。微微卫星序列:星序列:重复重复单位的位的长度度为16个核苷酸,有个核苷酸,有10 50个重复个重复单位串位串联组成。成。分散在基因分散在基因组中,大多不存在于中,大多不存在于编码序列内,具序列内,具有有较高的多高的多态性。性。目前微目前微卫星星DNA已已经发现了万余个位点。了万余个位点。TTCAGCTAGCTCAGCAGCAGCAGCAGCAGAGCTTGCAAGTCGATCGAGTCGTCGTCGTCGTCGTCTCGAACG微微卫星星DNAPCR扩增增结果(示例):果(示例):500bp400bp3
12、00bp240bp该结果果显示在所示在所检查的人群中,的人群中,该位点多位点多态性有性有4种。种。SSR标记的主要特点的主要特点:(1)数量丰富,广泛分布于整个基因)数量丰富,广泛分布于整个基因组;(2)具有)具有较多的等位性多的等位性变异;异;(3)共)共显性性标记,可,可鉴别出出杂合子和合子和纯合子;合子;(4)实验重复性好,重复性好,结果可靠;果可靠;(5)由于)由于创建新的建新的标记时需知道重复序列两端的序列信息,需知道重复序列两端的序列信息,因此其开因此其开发有一定困有一定困难,费用也用也较高。高。单核苷酸多核苷酸多态性性(singlenucleotidepolymorphism,S
13、NP)1.定定义单核苷酸多核苷酸多态性性(SNP)主要是指在基因主要是指在基因组水平上由水平上由单个个核苷酸的核苷酸的变异所引起的异所引起的DNA序列多序列多态性。性。不同个体不同个体间,基因,基因组DNA某部位的某部位的单核苷酸的核苷酸的变异。异。1996年,年,Lander报道了用道了用SNP制制备第三代第三代遗传连锁图的的遗传标记。2.SNP在人在人类基因基因组中出中出现的的频率率SNP在人在人类基因基因组中广泛存在,平均每中广泛存在,平均每5001000个碱个碱基基对中就有中就有1个,估个,估计其其总数可达数可达1700万个甚至更多。万个甚至更多。ThereisoneSNPinever
14、y1000basesleadstoanestimatethatanytwoindividualsdifferbyuptothreemillionSNPs.在基因在基因组DNA中,任何碱基均有可能中,任何碱基均有可能发生生变异,因此异,因此SNP既有可能在基因序列内,也有可能在基因以外的非既有可能在基因序列内,也有可能在基因以外的非编码序序列上。列上。总的来的来说,位于,位于编码区内的区内的SNP(cSNP)比比较少,因少,因为在在外外显子内,其子内,其变异率异率仅及周及周围序列的序列的1/5。但它在。但它在遗传性疾病研性疾病研究中却具有重要意究中却具有重要意义,因此,因此cSNP的研究更受关注
15、。的研究更受关注。3.SNP检测方法方法根据根据DNA列列阵的微的微测序法;序法;动态等位基因特异的等位基因特异的杂交;交;寡聚核苷酸特异的寡聚核苷酸特异的连接;接;DNA芯片以及芯片以及TaqMan系系统等。等。但不管哪一种方法,首先必但不管哪一种方法,首先必须进行靶序列的行靶序列的扩增,增,然后才能然后才能进行其它行其它检测。4.SNP用作用作遗传标记的的优点点SNP在人群中是二等位基因性的,在任何人群中其等位基在人群中是二等位基因性的,在任何人群中其等位基因因频率都可估率都可估计出来。出来。它在基因它在基因组中的分布中的分布较微微卫星星标记广泛得多。广泛得多。与串与串联重复的微重复的微卫
16、星位点相比,星位点相比,SNP是高度是高度稳定的,尤其定的,尤其是是处于于编码区的区的SNP(cSNP),而前者的高突而前者的高突变率容易引起率容易引起对人人群的群的遗传分析出分析出现困困难。部分位于基因内部的部分位于基因内部的SNP可能会直接影响可能会直接影响产物蛋白物蛋白质的的结构或基因表达水平,因此,它构或基因表达水平,因此,它们本身可能就是疾病本身可能就是疾病遗传机制的机制的候候选改改变位点。位点。易于易于进行自行自动化分析,化分析,缩短了研究短了研究时间。日本学者日本学者发现糖尿病基因的个人糖尿病基因的个人SNP差差别日本研究人日本研究人员最近最近经过研究研究发现,与糖尿,与糖尿病有
17、关的基因并不是病有关的基因并不是千篇一律,它千篇一律,它们之之间存在着个人差存在着个人差别,即,即“单核苷酸多核苷酸多态性性”(SNP)。)。预计今后今后SNP将在下列将在下列领域域发挥重要作用:重要作用:(1)进行行简单和复和复杂疾病的疾病的遗传连锁分析分析(linkageanalysis)及关及关联分析分析(associationanalysis),用于疾病易感基因定位;而且其用于疾病易感基因定位;而且其定位的精度将比微定位的精度将比微卫星星标记精精细得多,可直接用于指得多,可直接用于指导易感基易感基因克隆。因克隆。(2)在在“药药物基因物基因物基因物基因组组学学学学”(pharmacog
18、enomics)研究中,可通研究中,可通过检测SNP的的遗传多多态性性标记揭示人群中不同个体揭示人群中不同个体对不同不同药物的敏物的敏感性差异的根本原因。感性差异的根本原因。(3)也可用于法医研究的罪犯身份的也可用于法医研究的罪犯身份的鉴别、亲子子鉴定等,此外在定等,此外在器官移植中供体和受体器官移植中供体和受体间的配的配对选择及物种及物种进化的研究中都将化的研究中都将具有重要意具有重要意义。二、二、遗传作作图的方法的方法、遗传作作图的的遗传学原理学原理遗传图绘制主要依据的是制主要依据的是经典的孟德典的孟德尔遗传学的学的连锁和交和交换定律。减数分裂定律。减数分裂时,同源染色体彼此靠,同源染色体
19、彼此靠拢,同源区段并排形成双,同源区段并排形成双联体。在双体。在双联体中,并列的染色体臂在等价的位置体中,并列的染色体臂在等价的位置DNA交交换或或DNA重重组。因交。因交换的的频率与在染色体上所率与在染色体上所间隔的距离成正比,重隔的距离成正比,重组率率则可成可成为衡量基因之衡量基因之间相相对距离的尺度。通距离的尺度。通过重重组率可判断率可判断基因在染色体上的相基因在染色体上的相对位置,从而位置,从而绘制制遗传图。、不同模式生物的、不同模式生物的连锁分析分析对于不同的模式生物可采用有性于不同的模式生物可采用有性杂交交实验连锁分析以及系分析以及系谱分析作分析作图进行行遗传作作图。对于于细菌来菌
20、来说由于不由于不发生减数分裂,可生减数分裂,可通通过使使DNA片段从一个片段从一个细胞胞转移到另一个移到另一个细胞的胞的频率来率来测定定遗传距离,如距离,如转化、化、转导和接合和接合转移。移。第二第二节基因基因组物理物理图谱的构建的构建一、限制性作一、限制性作图在基因在基因组上上标定限制性定限制性酶切位点的相切位点的相对位置。主要适合位置。主要适合对小基因小基因组的原核生物和大片段的原核生物和大片段进行限制性位点分析。行限制性位点分析。二、二、DNA大片段重叠克隆的基因大片段重叠克隆的基因组作作图重叠克隆的基因重叠克隆的基因组作作图是先构建基因是先构建基因组的大片段基因文的大片段基因文库,然后
21、,然后根据克隆片段之根据克隆片段之间的重叠的重叠顺序构建重叠群,从而序构建重叠群,从而绘制物理制物理连锁图。覆盖基因覆盖基因组某一区域的若干具有一定重叠的某一区域的若干具有一定重叠的DNA区段所区段所组成的片成的片段群,称段群,称为重叠群重叠群。描述代表完整染色体片段的大片段重叠克隆的排列描述代表完整染色体片段的大片段重叠克隆的排列顺序的序的图谱称称为重叠群重叠群图谱。三、三、荧光光标记原位原位杂交作交作图荧光光标记原位原位杂交是通交是通过荧光光标记的探的探针与染色体与染色体杂交,从而确交,从而确定分子定分子标记在染色体上的在染色体上的实际物理位置。在物理位置。在细胞分裂中期染色体胞分裂中期染
22、色体处于高度于高度浓缩状状态,有可分辨的染色体,有可分辨的染色体带型及明型及明显的着的着丝粒位置,粒位置,通通过测定原位定原位杂交所交所显示的示的荧光信号所光信号所处的位置与染色体短臂末的位置与染色体短臂末端的相端的相对距离,距离,经过比例比例换算可将分子算可将分子标记标定在定在连锁图上。上。简单地地说,就是利用与,就是利用与荧光素分子偶光素分子偶联的的单克隆抗体与抗原克隆抗体与抗原标记的探的探针分子特异性的分子特异性的结合来合来检测DNA序列在染色体上的位置。序列在染色体上的位置。原位原位杂交技交技术的基本步的基本步骤:制制备探探针;染色体制片;染色体制片;染色体染色体处理与理与变性;性;染
23、色体与探染色体与探针杂交;交;显微微检测。荧光光标记探探针检测精子精子染色体染色体专一位点探一位点探针四、序列四、序列标签位点作位点作图序列序列标签位点作位点作图通通过PCR或分子或分子杂交将序列交将序列标签小小段段DNA序列在基因序列在基因组DNA中中进行定位。可用于构建最行定位。可用于构建最为详细的大基因的大基因组物理物理图。序列序列标签位点是一小段位点是一小段长度在度在100-500bp的的单拷拷贝DNA序列,当序列,当DNA大片段含有同一大片段含有同一STS序列序列时,说明明这两个片段彼此重叠,两个片段彼此重叠,根据重叠关系可以逐段根据重叠关系可以逐段绘制制DNA的物理的物理图。第三第
24、三节基因基因组测序(略)序(略)第四第四节基因基因组功能分析功能分析一、一、鉴定基因定基因组序列中的基因序列中的基因、通、通过序列分析序列分析查找基因找基因寻找基因的开放找基因的开放阅读框(框(openreadingframe);该方法方法对简单的的细菌基因菌基因组很有效。很有效。通通过网上序列比网上序列比对,寻找基因的同源性。找基因的同源性。2 2、基因确定的、基因确定的实验技技术分子分子杂交交检验某一片段是否含有表达序列某一片段是否含有表达序列cDNA测序有助于基因序有助于基因鉴定定确定确定转录本末端本末端异源双异源双链分析分析外外显子捕子捕获(exontrapping)外外显子捕子捕获寻
25、找外找外显子子时需要一个有两个已知外需要一个有两个已知外显子及插入其中的一个内子及插入其中的一个内含子含子组成小基因成小基因载体,且第一个外体,且第一个外显子前面有真核启子前面有真核启动子。将所研究的基子。将所研究的基因因组DNA片段插入片段插入载体内含子区域,然后体内含子区域,然后导入合适的入合适的细胞胞进行表达,行表达,转录产生的生的RNA再再进行剪切。如果将大量基因行剪切。如果将大量基因组片段插入片段插入该载体中构建成外体中构建成外显子捕子捕获文文库,将文,将文库表达后利用上述引物表达后利用上述引物进行行RT-PCR扩增增获得大量片段并得大量片段并测序,理序,理论上可以确定出一个基因上可
26、以确定出一个基因组上所有的外上所有的外显子序列。子序列。二、基因功能的确定二、基因功能的确定1 1、利用生物信息学分析基因功能、利用生物信息学分析基因功能就是以同源就是以同源检索索为基基础,通,通过把待把待鉴定的定的DNA序列或氨序列或氨基酸序列与数据基酸序列与数据库中所有的已知序列中所有的已知序列进行比行比较所所获得的相得的相似性来似性来发现新基因和推新基因和推测相相应的功能。的功能。基因失活(基因敲除)基因失活(基因敲除)基因超量表达探索基因功能基因超量表达探索基因功能基因基因编码的蛋白的蛋白质功能的深入研究功能的深入研究2、用、用实验分析确定基因功能分析确定基因功能反向反向遗传学:学:获
27、得基因得基因组序列之前研究基因功能是从表型开始,序列之前研究基因功能是从表型开始,确定控制表型相关确定控制表型相关基因及其序列,但到基因及其序列,但到获得基因得基因组序列之后序列之后则需要从未知功能的基因序列开始,确定它需要从未知功能的基因序列开始,确定它对应的功能和相关的的功能和相关的表型,即反向表型,即反向遗传学。学。三、基因三、基因组功能体功能体现蛋白蛋白质组(proteome):):指由一个指由一个细胞,一个胞,一个组织或一种生物的或一种生物的基因基因组所表达的全部相所表达的全部相应的蛋白的蛋白质。作。作为基因表达基因表达产物的蛋白物的蛋白质,其种,其种类和数量在不同的和数量在不同的时
28、间及及环境下是不同的,同一境下是不同的,同一时刻刻取得的蛋白取得的蛋白质组的数据,由于所的数据,由于所处不同的生理病理状不同的生理病理状态,是不,是不同的,即蛋白同的,即蛋白质组是一个是一个动态的概念。的概念。蛋白蛋白质组学(学(proteomics):研究蛋白研究蛋白质组或或应用大用大规模蛋白模蛋白质分分离和离和识别技技术研究蛋白研究蛋白质组的一的一门学科,是学科,是对基因基因组所表达的所表达的整套蛋白整套蛋白质的分析。的分析。蛋白蛋白质组学研究内容:学研究内容:包括包括对各种蛋白各种蛋白质的的识别和定量化,确定和定量化,确定它它们的的细胞内外的定位、修胞内外的定位、修饰、相互反、相互反应、
29、活性,、活性,最最终确定它确定它们的功能。并的功能。并对由此由此获取的数据取的数据进行数据行数据库构建,以及推构建,以及推动这一一学科学科进步的蛋白步的蛋白质组分析技分析技术的研究。的研究。蛋白蛋白质组学研究途径学研究途径:类似基因似基因组学的研究,即力学的研究,即力图“查清清”人人类大大约3万到万到4万多基因万多基因编码的所有蛋白的所有蛋白质,建立蛋白,建立蛋白质组数据数据库,即,即组成蛋白成蛋白质组学学研究;研究;着重于着重于寻找和找和筛选引起两个引起两个样本本之之间的差异蛋白的差异蛋白质谱产生的任何有意生的任何有意义的因素,揭示的因素,揭示细胞生理和胞生理和病理状病理状态的的进程与本程与本质,对外界外界环境刺激的反境刺激的反应途径,以及途径,以及细胞胞调控机制,同控机制,同时获得得对某些关某些关键蛋白的定性和功能分析,即蛋白的定性和功能分析,即比比较蛋白蛋白质组学学研究。研究。