《Geneandgenomics医学分子生物学.ppt》由会员分享,可在线阅读,更多相关《Geneandgenomics医学分子生物学.ppt(79页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、医学分子生物学遗传学与分子生物学系吕社民Tel:82657764分子生物学分子生物学是从分子水平研究生命现象、生命规律和生命本质的学科。核心内容是从分子水平研究基因和基因的活动,这些活动主要通过核酸和蛋白质的活动来实现。医学分子生物学主要研究人体生物大分子和大分子体系的结构、功能、相互作用及其与疾病发生、发展的关系。第一讲:基因和基因组第一节:基因一、基因(Gene)的概念基因简史:Mendal(1866):遗传因子Sutten(1903):染色体Johannson(1909):基因、基因型、表型Morgan(1910):基因学说Avery(1944):证实基因是由DNA组成基因是含有编码具有
2、生物功能产物(多肽链和RNA)的DNA片段。二、DNA(脱氧核糖核酸)的结构1.组成碱基包括腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)和胞嘧啶(C)脱氧核糖(碱基+脱氧核糖=脱氧核苷)磷酸(脱氧核苷+磷酸)3、5磷酸二酯键连接脱氧核糖核苷酸形成一条多核苷酸链2.DNA的双螺旋结构WalsonandCrick(1953-4-25)在英国杂志发表了一文,开启了生物医学的新时代(seeNature1953;171(4356):738-739)。DNAB型结构特点双股右手螺旋,方向相反。碱基在内,脱氧核糖、磷酸在外。直径2.37nm,螺距3.4nm,含10碱基对(basepair,bp)。碱基堆积力和
3、氢键(Walson-Crick键)是保持螺旋结构稳定性的主要作用力。碱基可以在多核苷酸链中任意排列。3.DNA的超螺旋结构三级结构即超螺旋结构(supercoil)。真核生物染色体(chromosome)呈线性,三级结构是DNA双链盘绕组蛋白(H2A,H2B,H3,H4)核心的表面,绕成核小体(nucleosome);许多核小体连接成串珠状,再反复盘旋折叠形成染色单体(chromatid)。DNA体积变小,利于包装;影响和其它分子作用。4.DNA的理化性质多元酸紫外吸收:最大吸收峰在260nm处变性、复性与杂交三、基因的结构特点和分类1.单拷贝基因与多基因家族断裂基因:外显子(exon)与内含
4、子(intron)启动子、增强子和终止子多基因家族:核苷酸序列或编码产物结构有同源性,其编码产物具有相似的功能的一组基因。包括:核酸序列相同核酸序列高度同源编码产物的功能或功能区同源基因超家族2.假基因3.重复序列DNA高度重复序列DNA:106中度重复序列DNA:10-105重复序列的多态性第二节模式生物基因组基因组(genome):细胞或生物体中,):细胞或生物体中,一套完整单倍体的遗传物质的总和一套完整单倍体的遗传物质的总和基因组学(genomics):发展和应用):发展和应用DNA制图、测序技术,及计算机程序制图、测序技术,及计算机程序分析生命体全部基因组结构及功能的分析生命体全部基因
5、组结构及功能的科学。包括:结构基因组学、功能基科学。包括:结构基因组学、功能基因组学、比较基因组学三个亚领域因组学、比较基因组学三个亚领域SpeciesGenome size(Mb)Number of chromosomesHuman30002n=46Mouse27002n=40Pig 27002n=38Cow 30002n=60Fugu 400Zebrafish 17002n=50Chicken 12002n=78Honey bee180n=16Drosophila1652n=8C.elegans 1002n=12Rise 4302n=24Wheat 17,0002n=6x=42Arabid
6、opsis 1002n=10Tomato 9502n=24Maize25002n=20White Spruce10,0002n=24S.cerevisiae15n=16E.coli4.7n=1H.influenze1.8n=1Mycoplasma genitalium0.58n=1一、病毒基因组结构与功能的特点1.1.不同病毒基因组大小相差较大不同病毒基因组大小相差较大2.2.不同病毒基因组可以是不同种类、结不同病毒基因组可以是不同种类、结构的核酸构的核酸3.3.病毒基因组有连续的也有不连续的病毒基因组有连续的也有不连续的 有有些些RNA病毒为不连续的片段病毒为不连续的片段4.4.编码序列大于
7、编码序列大于90%90%5.5.单倍体基因组单倍体基因组 除逆转录病毒外除逆转录病毒外6.6.基因有连续的和间断的基因有连续的和间断的7.7.相关基因丛集相关基因丛集 转录出多顺反子转录出多顺反子mRNA8.8.基因重叠基因重叠9.9.病毒基因组含有不规则结构基因病毒基因组含有不规则结构基因病毒基因组核酸的主要类型核酸类型转录方式复制特点病毒种类双链双链DNA类似细胞基因类似细胞基因 通过通过DNA复制过程完成基复制过程完成基因组复制;因组复制;先转录出一个先转录出一个RNA中间体中间体(前基因组),再通过逆转录(前基因组),再通过逆转录过程完成复制过程完成复制 大部分大部分DNA病毒病毒乙肝
8、病毒乙肝病毒(HBV)单链正股单链正股DNA类似细胞基因类似细胞基因通过通过DNA复制过程完成基因组复制过程完成基因组复制复制自主微小病毒、自主微小病毒、依赖微小病毒、依赖微小病毒、M13噬菌体等噬菌体等双链双链RNA以负链以负链RNA为模为模板转录出板转录出mRNA通过通过RNA复制过程完成基因组复制过程完成基因组复制复制动物呼肠弧病毒及动物呼肠弧病毒及所有的噬真菌体所有的噬真菌体单链负股单链负股RNA转录酶以负链转录酶以负链RNA为模板转录为模板转录出有帽尾出有帽尾mRNA负链负链RNA为模板,从头合成正为模板,从头合成正股股RNA(无帽尾),再以此链(无帽尾),再以此链为模板复制出负股为
9、模板复制出负股RNA单链正股单链正股RNA通过通过RNA复制过程完成基因复制过程完成基因组复制组复制通过通过DNA中间体,再通过逆中间体,再通过逆转录过程完成复制转录过程完成复制脊髓灰质炎病毒脊髓灰质炎病毒逆转录病毒逆转录病毒乙型肝炎病毒基因组带有部分单链区的环状双链带有部分单链区的环状双链DNA分子,分子,长长链为负股,长链为负股,长3.2kb;短链为正股,在不同;短链为正股,在不同的分子中长度不同的分子中长度不同两链两链5端端250b互互补补成粘末端成粘末端以负股以负股DNA为模板转录的为模板转录的RNA有有4个个ORF,分别称为,分别称为S、C、P、X,其中,其中P区域与其区域与其它三个
10、它三个ORF重叠重叠乙型肝炎病毒基因组结构和功能S区:编码病毒的外膜蛋白,由区:编码病毒的外膜蛋白,由S基因、前基因、前S1区(区(pre-S1)、前)、前S2区段(区段(pre-S2)构成)构成主要蛋白主要蛋白:即即S蛋白(蛋白(HBsAg),226个个a.a.,由,由S基因编码,基因编码,中蛋白中蛋白:由由pre-S2 和和S基因编码,基因编码,281个个a.a.大蛋白大蛋白:由由pre-S1、pre-S2 和和S基因编码基因编码乙型肝炎病毒基因组结构和功能C区段:编码核心抗原(区段:编码核心抗原(HBcAg),羧基端),羧基端富富Arg水解后转变为分泌性水解后转变为分泌性e抗原(抗原(H
11、BeAg)P区段:编码区段:编码DNA聚合酶,是依赖聚合酶,是依赖RNA的的DNA聚合酶(逆转录酶)聚合酶(逆转录酶)X区段:区段:X蛋白功能尚不十分清楚,可能是反蛋白功能尚不十分清楚,可能是反式激活因子式激活因子 二、原核生物基因组结构和功能的特点1.通常仅有一条环状双链通常仅有一条环状双链DNA分子组成分子组成2.只有一个复制起点只有一个复制起点3.具有操纵子结构具有操纵子结构4.编码序列一般不重叠编码序列一般不重叠5.基因是连续的基因是连续的二 原核生物基因组结构和功能的特点6.编码区在基因组中所占比例约为编码区在基因组中所占比例约为50%7.基因组中重复序列很少基因组中重复序列很少8.
12、有编码同工酶的基因(有编码同工酶的基因(isogene)9.存在可移动的存在可移动的DNA序列,包括插入序列序列,包括插入序列和转座子和转座子10.具有多种功能的识别区具有多种功能的识别区原核生物基因组研究及意义更好的了解病原微生物的治病机理更好的了解病原微生物的治病机理加快致病微生物致病基因的发现加快致病微生物致病基因的发现提高临床诊断的效率和准确性提高临床诊断的效率和准确性筛选有效药物及发展疫苗筛选有效药物及发展疫苗第三节 人类基因组的组织结构特点人类基因组的重复序列人类基因组的重复序列人类基因组中的多态性人类基因组中的多态性一人类基因组的重复序列反向重复顺序(反向重复顺序(inverte
13、d repeats)是指两个顺)是指两个顺序相同的拷贝在序相同的拷贝在DNA链上呈反向排列。约占链上呈反向排列。约占5%,常见于调控区,常见于调控区两个反向重复顺序间隔一段间隔顺序两个反向重复顺序间隔一段间隔顺序两个反向重复顺序间串联排列形成回文结构两个反向重复顺序间串联排列形成回文结构一人类基因组的重复序列串联重复顺序(串联重复顺序(tandem repeats)约占约占10%编码区串联重复顺序:组蛋白基因编码区串联重复顺序:组蛋白基因非编码区串联重复顺序:通常存在于间隔非编码区串联重复顺序:通常存在于间隔DNA和内含子中和内含子中大卫星大卫星DNA(macrosatellite DNA)小
14、卫星小卫星DNA(miniosatellite DNA)微卫星微卫星DNA(microsatellite DNA)小卫星DNA小卫星小卫星DNA(minisatellite DNA)一类中等)一类中等大小的串联重复序列,长大小的串联重复序列,长0.1-20kb,分布于,分布于所有染色体所有染色体高度可变的小卫星高度可变的小卫星DNA 呈高度多态性,呈高度多态性,与细胞的同源重组有关,不能转录与细胞的同源重组有关,不能转录端粒端粒DNA微卫星DNA微卫星微卫星DNA(microsatellite DNA)一类简)一类简单的寡核苷酸串联重复序列,分布于所有染单的寡核苷酸串联重复序列,分布于所有染色
15、体,重复色体,重复2-6bp约约10-60次,总长度常小于次,总长度常小于150bp一人类基因组的重复序列散在重复顺序散在重复顺序 多为转座元件,且为反转录转多为转座元件,且为反转录转座座SINEs(short interspersed nuclear elements)Alu家族家族LINEs(long interspersed nuclear elements)Kpn家族家族NumberofcopiesandfractionofgenomeforclassesofinterspersedrepeatNumber of copies(x1,000)Total number of bases(
16、mb)Fraction of the draft genome sequence(%)SINEs1,558359.613.14LINEs868558.820.42LTR elements4432278.29DNA elements29477.62.84Unclassified33.80.14Total 1,226.844.83二人类基因组中的多态性DNA位点多态性(位点多态性(DNA site polymorphism):是由于等位基因间在特定):是由于等位基因间在特定位点上位点上DNA序列的差异造成的序列的差异造成的限制性片段长度多态性(限制性片段长度多态性(restriction frag
17、ment length polymorphism,RFLP):即):即用同一种限制性内切酶消化不同个体的用同一种限制性内切酶消化不同个体的DNA时,会产生各不相同的限制性片段类型时,会产生各不相同的限制性片段类型二人类基因组中的多态性串联重复顺序多态性(串联重复顺序多态性(tandem repeats polymorphism):其重复单位很小,重复次):其重复单位很小,重复次数变化较大,也称可变数目串联重复顺序数变化较大,也称可变数目串联重复顺序(variable number of tandem repeats,VNTRs)是一种长度多态性)是一种长度多态性小卫星小卫星DNA多态性多态性微
18、卫星微卫星DNA多态性多态性PolymorphismPolymorphism:strictly,the existence of two or more variants(alleles,phenotypes,sequence variants,chromosome structure variants)at significant frequencies in population.Looser usages among molecular geneticists include (1)any sequence variant present at a frequency 1%in a po
19、pulation,(2)any nonpathogenic sequence variant,regardless of frequency.PolymorphismPolymorphism markerSNPs(single nucleotide polymorphisms,SNPs)More than 1.4 million single nucleotide polymorphisms(SNPs)in the human genome have been identifed.SSR(Simple sequence repeat,SSR)a sequence consisting larg
20、ely of a tandem repeat of a specifc k-mer(such as(CA)15).Many SSRs are polymorphic and have been widely used in genetic mapping.三 人类基因组计划简介人类基因组作图遗传图(genetic map):以具有遗传多态性的:以具有遗传多态性的遗传标记为遗传标记为“位标位标”,遗传学距离为,遗传学距离为“图距图距”的基因组图的基因组图Genetic map A genome map in which polymorphic loci are positioned relati
21、ve to one another on the basis of the frequency with which they recombine during meiosis.The unit of distance is centimorgans(cM),denoting a 1%chance of recombination.人类基因组作图物理图(physical map):以一段已知核苷酸序:以一段已知核苷酸序列的列的DNA片段为片段为“位标位标”,以,以DNA实际距离实际距离(Mb或或kb)作为)作为“图距图距”的基因组图的基因组图转录图(transcription map):以表达
22、序列标:以表达序列标签(签(EST)为位标,又称)为位标,又称cDNA图或表达序列图或表达序列图图序列图(sequence map):确定人类基因组的核:确定人类基因组的核苷酸顺序苷酸顺序第四节基因组与医学一基因鉴定定位克隆(定位克隆(positional cloning)候选克隆:定位候选和功能候选克隆候选克隆:定位候选和功能候选克隆定位克隆定位克隆策略:即建立表型(包括疾病)定位克隆策略:即建立表型(包括疾病)与基因组中某一部位(或区域)之间的联与基因组中某一部位(或区域)之间的联系,然后根据这一位置信息,应用物理图系,然后根据这一位置信息,应用物理图的物理标记来将经典遗传学信息转变为物的
23、物理标记来将经典遗传学信息转变为物理标记所代表的明确的基因组区域,在以理标记所代表的明确的基因组区域,在以相关区域的邻接克隆群来筛选可表达的结相关区域的邻接克隆群来筛选可表达的结构基因,即建立局部的转录图。构基因,即建立局部的转录图。常见病易感基因的定位克隆肥胖、肿瘤、心血管疾病、糖尿病等都有遗传因素的涉及多基因、多因素遗传异质性阐明病因及发病机理ExamplesofdiseasegenesidentifiedbypositionalcloningDisease MIM no.Map positionGene Approach Duchenne muscular dystrophy310200
24、Xp21.3DystrophinClone translocation breakpointsClone sequences missing in a patient with a deletionCystic fibrosis2197007q31CFTRLinkage disequilibriumBranchio-oto-renal syndrome1136508q13EYA1Sequencing genomic clones;homology to Drosophila geneTreacher Collins syndrome 1545005q32-33.1TCOF1Transcript
25、 mapping二药物基因组学用药个体化已知基因加快新药开发单核苷酸多态性(单核苷酸多态性(单核苷酸多态性(单核苷酸多态性(SNPsSNPsSNPsSNPs)Single NucleotideSingle Nucleotide Polymorphisms Polymorphisms 1,Introduction 2,Defination and classification 3,Features of SNPs 4,SNP mapping 5,Usage in biomedicine 6,SNPs databaseGenetic VariationGenetic VariationDNA Ma
26、rkers1980 RFLPs(restriction fragment length polymorphisms)1985 VNTRs(variable number tandem repeats,small-satellites)STRs (short tendem repeats,Micro-satellites)1990s SNPs (single-nucleotide polymor-phisms)限制性片段长度多态性限制性片段长度多态性 RFLPs(restriction fragment length polymorphisms)短串联重复序列短串联重复序列STRs (short
27、 tendem repeats,Microsatellites)STR广泛存在于人基因组,占约广泛存在于人基因组,占约5%,基本单位是基本单位是1bp-8bp的串联重复,的串联重复,重复次数重复次数 n=15-60,已知,已知8000多个,多个,主要形式为:主要形式为:(CA)n,(GA)n,(AA)n,(GG)n,(CAA)n,(CGG)n,其中以其中以(CA)n,(GT)n 为多见。为多见。1992年,年,Welssenbanch等以等以STR为标记的为标记的第二代连锁图取代了第二代连锁图取代了RFLP连锁图连锁图。可变数目串联重复序列可变数目串联重复序列VNTRs(variable nu
28、mber tandem repeats)每个每个 VNTR 都含有都含有10-15 bp核心序列,核心序列,VNTR与与STR比较类似,但是重复顺序更长;比较类似,但是重复顺序更长;多态性及分布方面不如多态性及分布方面不如STR,因而,因而VNTR作作为遗传标记只是一种过渡,目前已较少使用,为遗传标记只是一种过渡,目前已较少使用,但是,但是,VNTR曾经对曾经对STR的基因定位运用起到的基因定位运用起到推动作用。推动作用。定义:不同个体间,基因组定义:不同个体间,基因组DNA某部位的某部位的 单核苷酸的变异。单核苷酸的变异。1996年,年,Lander报道了用单核苷酸多态性报道了用单核苷酸多态
29、性标记(标记(single nucleotid polymorphism SNP)制备第三代遗传连锁图的遗传标记。制备第三代遗传连锁图的遗传标记。单核苷酸多态性单核苷酸多态性(single nucleotid polymorphism,SNP)RFLP,Less polymorphysismPIC:0.3not even in genomeSTR1/100kb200kbPIC:0.7not even in genomeAutomilizationSNP1/1003-300bpDichomityStabilityEven in genomeDNA arrayFrequency of SNP in
30、 Human Genome1,The most abundant DNA marker present in the human genome,about 90%of sequences variants in human are SNP.2 out of thirds are C to T2,A few hundred thousand are currently identified,but 17 million of SNPs out of 3 billion are estimated.3,SNPs in coding regions of genes have been termed
31、 cSNPs,about 500,000 of cSNPs and an average of about 6 per gene.The Functional Effects of cSNPs Amino acid changeno change of amino acidThe Functional Effects of SNPs Outside ExonsIn Regulatory regionApplications of SNPs as Genome MarkersIndividual identificationHuman evolutionBiomedical researchSN
32、Ps in Human DiseasesSNPs的作图的作图有两种不同而又互补的方法可进行全基因组关联分析。一种是直接检测候选基因编码区中所有常见的功能性变异;另一种是使用分布在编码区和非编码区的高密度SNPS标记,来分析易感人群和对照人群,根据连锁不平衡分析特定的SNPs与表型的关联。无论是致病变异还是群体进化的研究,建立高密度SNPs遗传图是必需的。SNP作图的一般步骤包括:获取DNA序列;从DNA序列确定序列标签位点(sequencetaggedsites,STSs);扫描STSs或ESTs确定候选SNPs;确定SNPs;将SNPs定位于染色体特定位置。Monogenic Disorde
33、r in Human Diseases SNPs in monogene influence virtuallyhuman disease 1,Susceptibility and resistance to the disorder,2,Gene-environmental factors.e.g.Huntingtons diseasecystic fibrosis SNPs in Complex Human Diseases many of the diseases involve multiple genes,each contributing a small quantity of t
34、he overall disease susceptibility.Oliogenic,multigenic and gene-environmental interaction AssociationStudyLinkagestudySNPs in PharmacogenomicsIndividualization medicineDrug discoveryPolymorphisms of genes involving in Admet(absorbption,distrubution,metabolism,excretion and toxibility).SNPs affecting drug effectsSNPs Genotyping 1,Direct sequencing of DNA2,Specific hybrization3,Single-strand conformation polymorphism analysis4,High-density DNA arrays5,Primer-extention 6,PyrosequencingSNPs Databases http:/http:/Thanks&Questions