基因多态性与疾病发生遗传易感性_深圳汇总课件.ppt-淘文阁

资源描述

《基因多态性与疾病发生遗传易感性_深圳汇总课件.ppt》由会员分享，可在线阅读，更多相关《基因多态性与疾病发生遗传易感性_深圳汇总课件.ppt（101页珍藏版）》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、基因多态性基因多态性与疾病发生遗传易感性与疾病发生遗传易感性GenePolymorphismandGeneticSusceptibilitytoDisease6/2/20231提提纲纲1.单核苷酸多态性单核苷酸多态性SingleNucleotidePolymorphism2.基因多态性与疾病发生遗传易感性基因多态性与疾病发生遗传易感性GenePolymorphismandGeneticSusceptibilitytoDisease3.基因多态性与基因转录调控基因多态性与基因转录调控GenePolymorphismandRegulationofGeneTranscription4.展望展望Fu

2、tureProspects6/2/20232DNA Structure6/2/20233基因突变基因突变o基因突变基因突变（mutation)：由于由于DNA碱基对的置换、插入或缺碱基对的置换、插入或缺失而引起的基因结构的变化失而引起的基因结构的变化，亦称点突变。，亦称点突变。o根据根据基因结构基因结构的改变方式，的改变方式，基因突变可分为碱基置换突基因突变可分为碱基置换突变和移码突变两种类型：变和移码突变两种类型：n碱基置换突变碱基置换突变：由一个错误的碱基对替代一个正确的碱基对的：由一个错误的碱基对替代一个正确的碱基对的突变叫碱基置换突变。碱基替换过程只改变被替换碱基的那个突变叫碱基置换突

3、变。碱基替换过程只改变被替换碱基的那个密码子，也就是说每一次碱基替换只改变一个密码子，不会涉密码子，也就是说每一次碱基替换只改变一个密码子，不会涉及到其他的密码子。及到其他的密码子。n移码突变移码突变：基因中插入或者缺失一个或几个碱基对，使：基因中插入或者缺失一个或几个碱基对，使DNA的的阅读框架（读码框）发生改变，导致插入或缺失部位之后的所阅读框架（读码框）发生改变，导致插入或缺失部位之后的所有密码子都跟着发生变化，结果产生一种异常的多肽链。有密码子都跟着发生变化，结果产生一种异常的多肽链。6/2/20234基因突变基因突变o根据根据遗传信息遗传信息的改变方式，的改变方式，基因突变又可以分为

4、同义突变、错义基因突变又可以分为同义突变、错义突变和无义突变三种类型：突变和无义突变三种类型：n同义突变同义突变：DNA的一个碱基对的改变并不会影响它所编码的蛋白质的一个碱基对的改变并不会影响它所编码的蛋白质的氨基酸序列，这是因为改变后的密码子和改变前的密码子是的氨基酸序列，这是因为改变后的密码子和改变前的密码子是简并简并密码子密码子，它们编码同一种氨基酸，这种基因突变称为同义突变。，它们编码同一种氨基酸，这种基因突变称为同义突变。n错义突变错义突变：由于一对或几对碱基对的改变而使决定某一氨基酸的密：由于一对或几对碱基对的改变而使决定某一氨基酸的密码子变为决定另一种氨基酸的密码子的基因突变叫错

5、义突变。码子变为决定另一种氨基酸的密码子的基因突变叫错义突变。这种这种基因突变有可能使它所编码的蛋白质部分或完全失活。基因突变有可能使它所编码的蛋白质部分或完全失活。n无义突变无义突变：由于一对或几对碱基对的改变而使决定某一氨基酸的密：由于一对或几对碱基对的改变而使决定某一氨基酸的密码子变成一个码子变成一个终止密码子终止密码子的基因突变叫无义突变。的基因突变叫无义突变。6/2/20235单核苷酸多态性单核苷酸多态性o单单核核苷苷酸酸多多态态性性（singlenucleotidepolymorphism，SNPs）：是是指指在在基基因因组组水水平平上上由由单单个个核核苷苷酸酸的的变变异异所所引引

6、起起的的DNA序序列列多多态态性性。它它是是人人类类可可遗遗传传的的变变异异中中最最常常见见的的一一种种，占占所所有有已已知知多多态态性性的的90%以以上上。SNP在在人人类类基基因因组组中中广广泛泛存存在在，平平均均每每500-1000个个碱碱基基对对中中就就有有1个个，人人类类30亿亿碱碱基基中中大大约约有有1000万个万个SNPs。oSNP所所表表现现的的多多态态性性可可以以只只涉涉及及到到单单个个碱碱基基的的变变异异，这这种种变变异异可可由由单单个个碱碱基基的的转转换换(transition，嘌嘌呤呤嘌嘌呤呤或或嘧嘧啶啶嘧嘧啶啶)或或颠颠换换(transversion，嘌嘌呤呤嘧嘧啶啶

7、)所所引引起起，也也可可由由碱碱基基的插入或缺失所致。但通常所说的的插入或缺失所致。但通常所说的SNP并不包括后两种情况。并不包括后两种情况。6/2/20236单核苷酸多态性单核苷酸多态性o理论上，理论上，SNPs可以分二、三和四等位基因，但可以分二、三和四等位基因，但人类一人类一般为二等位基因（般为二等位基因（biallelic）。二等位基因有。二等位基因有4种不同类种不同类型，包括型，包括1种转换种转换CT(GA)和和3种颠换种颠换CA(GT)、CG(GC)、TA(AT)。四种。四种SNPs类型在人类中的发类型在人类中的发生频率不同，生频率不同，最常见的为最常见的为CT(GA)转换转换，约

8、占，约占2/3，其，其它它3种类型发生的频率相同。之所以转换几率高，可能种类型发生的频率相同。之所以转换几率高，可能是因为是因为CpG二核苷酸上的胞嘧啶残基是人类基因组中最二核苷酸上的胞嘧啶残基是人类基因组中最易发生突变的位点，其中大多数是甲基化的，可自发地易发生突变的位点，其中大多数是甲基化的，可自发地脱去氨基而形成胸腺嘧啶。脱去氨基而形成胸腺嘧啶。6/2/20237单核苷酸多态性单核苷酸多态性Example of an SNP comprising a GA substitutionElectropherograms produced by fluorescence-based seque

9、ncing using an ABI 3700 showing the genomic DNA from an individual homozygous for G at the site of the SNP(a)and an individual homozygous for A(b).The base substitution is denoted by an arrow.6/2/20238单核苷酸多态性单核苷酸多态性o人类基因组中大约估计每个基因有人类基因组中大约估计每个基因有2个常见的错义突变个常见的错义突变o在公共数据库中至少有在公共数据库中至少有500万个万个SNPs。o仅有少

10、量（可能为仅有少量（可能为50,000250,000）SNPs在一定程度上（小到中等在一定程度上（小到中等度）能反映与疾病发生危险相关的表型。度）能反映与疾病发生危险相关的表型。o根根据据SNP在在基基因因中中的的位位置置，可可分分为为基基因因编编码码区区SNPs（Coding-regionSNPs，cSNPs）、基基因因周周边边SNPs（PerigenicSNPs，pSNPs）以以及及基因间基因间SNPs（IntergenicSNPs，iSNPs）等三类。）等三类。oSNPs在在基基因因组组中中的的分分布布十十分分广广泛泛，但但不不同同的的区区域域出出现现的的频频率率不不同同。人类单碱基等位

11、基因十分稳定。人类单碱基等位基因十分稳定。o人类人类SNPs大部分大部分(85%)是共有的。是共有的。6/2/20239单核苷酸多态性单核苷酸多态性63%Intronic（内含子）（内含子）24%Locusregion（基因座区）（基因座区）11%Untranslatedregion（非翻译区）（非翻译区）1%Nonsynonymous（nsSNPs，错义，错义SNPs）1%Synonymous（同义（同义SNPs）1%Splicesite（剪接位点）（剪接位点）1,increased riskOR 1,protective effectQuestionnaire dataBiomarker

12、assays6/2/202343研究设计和统计分析研究设计和统计分析以基于医院的肿瘤病例以基于医院的肿瘤病例对照研究为例对照研究为例o病例病例：病人应为新诊断、病理学确诊；未经放疗或化疗；无肿瘤病：病人应为新诊断、病理学确诊；未经放疗或化疗；无肿瘤病史；无输血史史；无输血史o对照对照：无肿瘤者，可从医疗或保健机构中招募的，与病例无生物学：无肿瘤者，可从医疗或保健机构中招募的，与病例无生物学上相关的医疗求助者或病人陪伴着。病例应与对照在年龄、性别、上相关的医疗求助者或病人陪伴着。病例应与对照在年龄、性别、种族和吸烟状况上在频率上相匹配或采用个体匹配。种族和吸烟状况上在频率上相匹配或采用个体匹配。

13、o正式的正式的知情同意书知情同意书、流行病学调查表流行病学调查表和和血液采集。血液采集。o统计分析统计分析：采用：采用t检验、方差检验和多因素检验、方差检验和多因素logistic回归分析等。回归分析等。6/2/202344研究设计和统计分析研究设计和统计分析o选定暴露于及未暴露于某因素的两组人群选定暴露于及未暴露于某因素的两组人群，随访观察一定的期间，比较两组人群某种疾病，随访观察一定的期间，比较两组人群某种疾病的结局，从而判断该因素与发病或死亡有无关联及关联大小的研究方法。的结局，从而判断该因素与发病或死亡有无关联及关联大小的研究方法。o特点特点n属于属于观察法观察法，需设立对照组。，需设

14、立对照组。由由“因因”及及“果果”，时序合理，检验暴露因素与疾病，时序合理，检验暴露因素与疾病的的因果联系科学性强。因果联系科学性强。n最大优点是可以最大优点是可以获取相对真实而可靠的资料。获取相对真实而可靠的资料。但是如果需要观察大量人群，则花费但是如果需要观察大量人群，则花费太大。太大。n如果疾病的潜伏期很长，则需要观察的时间很长。这些都会影响其可行性。如果疾病的潜伏期很长，则需要观察的时间很长。这些都会影响其可行性。o用途用途n检验病因假设检验病因假设：验证某种暴露因素对某种疾病发病率或死亡率的影响，也可同时观：验证某种暴露因素对某种疾病发病率或死亡率的影响，也可同时观察某种暴露因素对人

15、群健康的系统影响。察某种暴露因素对人群健康的系统影响。n描述疾病的自然史描述疾病的自然史：疾病的自然发展过程，包括疾病的起病（病理发生期）、潜伏：疾病的自然发展过程，包括疾病的起病（病理发生期）、潜伏期期(隐伏期隐伏期)、临床前期、临床期到结局的全过程。、临床前期、临床期到结局的全过程。前瞻性队列（或群组）研究（Cohort Study)6/2/202345Susceptibility:Susceptibility:Diet,Diet,Metabolism,Metabolism,DNA damage&RepairDNA damage&RepairCarcinogenes CancerCance

16、r-freeGenetic predisposition?(遗传易患体质？遗传易患体质？)Biomarkers for prevention and early detection?Cohort Study6/2/202346研究设计和统计分析研究设计和统计分析又称为单纯病例研究（又称为单纯病例研究（caseonlystudy）或病例系列研究（或病例系列研究（caseseriesstudy）。病例）。病例-病例研究是近年来被病例研究是近年来被广泛应用于疾病病因研究中评价基因与广泛应用于疾病病因研究中评价基因与环境交互作用的一种方法环境交互作用的一种方法，该方法仅通过某一疾病患者群体来评价基因型

17、与，该方法仅通过某一疾病患者群体来评价基因型与环境暴露的交互作用，但不能评价二者各自的主效应。环境暴露的交互作用，但不能评价二者各自的主效应。有时在一般病例对照研究中不易有时在一般病例对照研究中不易选择合适的对照选择合适的对照，特别是在分子流行病学研，特别是在分子流行病学研究中，究中，从无疾病的对照中去获取某种生物标本也受到医学伦理从无疾病的对照中去获取某种生物标本也受到医学伦理方面的制约。方面的制约。如果对一种疾病的如果对一种疾病的两个亚型进行对比研究两个亚型进行对比研究，例如出血型脑卒中与缺血型脑卒，例如出血型脑卒中与缺血型脑卒中、中、p53突变阳性基因型的食管癌与突变阳性基因型的食管癌与

18、p53突变阴性基因型的食管癌或者食管癌突变阴性基因型的食管癌或者食管癌的鳞癌与腺癌的比较研究，可以不另外设对照组，而采取两个亚组的直接比的鳞癌与腺癌的比较研究，可以不另外设对照组，而采取两个亚组的直接比较。较。这种设计可以免除从无病的对照组收集资料特别是生物标本的麻烦，这种设计可以免除从无病的对照组收集资料特别是生物标本的麻烦，适用于适用于研究两组病因的差异部分研究两组病因的差异部分，而其相同或近似的危险因素则将被掩盖或低估。而其相同或近似的危险因素则将被掩盖或低估。病例-病例研究（Case-Case Study）6/2/202347研究设计和统计分析研究设计和统计分析应用的前提条件：在正常人

19、群中基因型与环境暴露各自独立发生，而且所应用的前提条件：在正常人群中基因型与环境暴露各自独立发生，而且所研究的疾病为罕见病研究的疾病为罕见病(此时可用此时可用OR来估计来估计RR值值)。基本步骤：基本步骤：1.确定某一患者群体作为研究对象确定某一患者群体作为研究对象2.收集病人的一般情况、协变量、环境暴露资料，以及生物标本。收集病人的一般情况、协变量、环境暴露资料，以及生物标本。3.采用分子生物学技术检测基因型采用分子生物学技术检测基因型4.根据某一基因型的有无将研究对象分为类病例组和类对照组根据某一基因型的有无将研究对象分为类病例组和类对照组5.统计分析，计算统计分析，计算OR值、值、P值。

20、值。6.判断有无相乘模型的交互作用及显著性意义。若有，进一步判断为正判断有无相乘模型的交互作用及显著性意义。若有，进一步判断为正相乘作用还是负相乘作用。相乘作用还是负相乘作用。病例-病例研究（Case-Case Study）6/2/202348Blood Sample Processing and Biomarker Assay Flow ChartPHAPHASpinWhole blood short-term culture 1ml 1ml 1mlMutagen sensitivityassayBPDE ControlBPDEGamma 1mlBPDE-Induce DNA adducts

21、 assayDNAextraction 1mlRT-PCR forgene expressionLong-termstoragecDNADNA 1mlRNAextractionGenotypingLymphocyte isolation(frozen)CAT/LucassaysDNA repaircapacity2 mleachTransfectionHeparinized,10-30 ml Sample collection(cases and controls)1mlPlasmaSerum 6/2/202349研究设计研究设计和统计分析和统计分析o相关性研究结果可重复吗？相关性研究结果可重

22、复吗？遗憾的是，大多数结果不能重复。遗憾的是，大多数结果不能重复。1.假阳性假阳性报告（报告（false-positivereports)：伪相关：伪相关（spuriousassociations)2.假阴性假阴性报告（报告（false-negativereports）：该研究无）：该研究无足够的效能来识别该相关性足够的效能来识别该相关性3.人群之间存在的差异人群之间存在的差异（populationdifferences）6/2/202350研究设计研究设计和统计分析和统计分析o在相关性研究结果缺乏一致性时，应采用在相关性研究结果缺乏一致性时，应采用何种何种可信度水平可信度水平？1.大样本大样

23、本(largesamplesize)2.避免出版偏差避免出版偏差(avoidpublicationbias)3.种族分层种族分层(ethnicstratification)6/2/202351研究设计研究设计和统计分析和统计分析o影响相关性研究结果的因素：影响相关性研究结果的因素：1.病因学病因学上的上的复杂性复杂性(etiologicalcomplexity)2.统计效能统计效能和和采样设计采样设计(statisticalpowerandsamplingdesign)3.人群结构人群结构(populationstructure)4.数据解释数据解释(datainterpretation)6/

24、2/202352研究设计研究设计和统计分析和统计分析o数据解释（数据解释（DataInterpretation）有几种情况：显著关联、无重要关联、无法决定。有几种情况：显著关联、无重要关联、无法决定。1.假阳性报告概率假阳性报告概率（falsepositivereportprobability，FPRP）有助于作出判断）有助于作出判断2.FPRP取决于取决于先验概率先验概率（priorprobability）、）、统计效能统计效能（statisticalpower）和）和效能指数效能指数（effectsize）。）。统计效能统计效能：指当：指当H0为错时你正确地拒绝为错时你正确地拒绝H0的概率

25、（的概率（significanceoftherelationshipundertest）效能指数效能指数：是指被检验的两变量之间关系的强度：是指被检验的两变量之间关系的强度(strengthoftherelationshipundertest）。两者均与样本大小有关。）。两者均与样本大小有关。6/2/202353研究设计研究设计和统计分析和统计分析o数据解释（数据解释（DataInterpretation）1.当先验概率较高时，那么假阳性报告概率将较低，当先验概率较高时，那么假阳性报告概率将较低，其关联性将更趋正确。其关联性将更趋正确。2.研究者必须选择一个临床或病因学上有意义的效研究者必须选

26、择一个临床或病因学上有意义的效能指数，如相对危险度（能指数，如相对危险度（relativerisk，RR）或比）或比值比（值比（oddsratio,OR）以及先验范围。以及先验范围。3.通常我们计算并比较通常我们计算并比较OR值值及其及其95%可信限可信限（95%confidenceinterval,95%CI）。）。6/2/202354提提纲纲1.单核苷酸多态性单核苷酸多态性SingleNucleotidePolymorphism2.基因多态性与疾病发生遗传易感性基因多态性与疾病发生遗传易感性GenePolymorphismandGeneticSusceptibilitytoDisease

27、3.基因多态性与基因转录调控基因多态性与基因转录调控GenePolymorphismandRegulationofGeneTranscription4.展望展望FutureProspects6/2/202355启动子与基因转录6/2/202356Promoter Region6/2/202357Control sites in DNA provide binding sites for proteins;coding regions are expressed via the synthesis of RNA6/2/202358基本概念基本概念启动子启动子(promoter):位于结构基因位于

28、结构基因5端上游的一段端上游的一段DNA序列序列1.指导全酶指导全酶(holoenzyme)同模板正确结合同模板正确结合2.活化活化RNA聚合酶聚合酶3.启动基因转录启动基因转录启动子区启动子区(promoterregion):RNA聚合酶聚合酶(RNApolymerases)同启动子结合的区域同启动子结合的区域RNA聚合酶聚合酶:利用利用DNA模板合成模板合成RNA的酶的酶6/2/202359RNA聚聚合合酶酶的的活活性性形形式式(全全酶酶)为为15S，由由5种种不不同同的的多多肽肽链链构构成成，按按分分子子量量大大小小排排列列分分别别为为(155000)，(151000)，(7000)，(

29、36500)和和(11000)。每每分分子子RNA聚聚合合酶酶除除有有两两个个亚亚基基外外，其其余余亚亚基基均均只只有有一一个个，故故全全酶酶为为2(450000)。全酶是指酶蛋白及其辅酶构成的有功能的复合物。全酶是指酶蛋白及其辅酶构成的有功能的复合物。6/2/202360The function of RNA polymerase is to copy one strand of duplex DNA into RNA6/2/202361基本概念基本概念共共有有序序列列(consensussequence)是是指指与与真真实实序序列列相相比比，启启动动子子每每个个位位置置最最常常出出现现的的

30、理理想想化化碱碱基基序序列列。即即将将所所有有已已知知启启动动子子排排列列起起来来以以求求其其最最大大相相似似性性。一一个个序序列列如如果果为为共共有有，则则每每一一个个特特定定碱碱基基都都理理应应在在相相应应位位置置上上有有分分布布优优势势。大大多多数共有序列间的碱基差异不能超过数共有序列间的碱基差异不能超过1-2个。个。6/2/202362启动子结构启动子结构 1.有多种元件有多种元件：TATA框、框、GC框、框、CATT框、框、OCT等。等。2.结结构构不不恒恒定定：有有的的有有多多种种框框盒盒如如组组蛋蛋白白H2B；有有的的只只有有TATA框框和和GC框，如框，如SV40早期转录蛋白。

31、早期转录蛋白。3.它们的它们的位置位置、序列序列、距离距离和和方向方向都不完全相同。都不完全相同。4.有的存在有的存在远距离的调控元件远距离的调控元件，如增强子。，如增强子。5.这些元件常起到这些元件常起到控制转录效率和选择起始位点控制转录效率和选择起始位点的作用。的作用。6.不不直直接接和和RNA聚聚合合酶酶结结合合。转转录录时时先先和和其其它它转转录录激激活活因因子子相相结结合合，再和聚合酶结合。再和聚合酶结合。真核生物中有三种不同的RNA聚合酶，因此也有三种不同的启动子，其中以启动子最为复杂，它和原核的启动子有很多不同：6/2/202363RNA聚聚合合酶酶的的核核心心酶酶虽虽可可合合成

32、成RNA，但但不不能能找找到到模模板板DNA上上的的转转录录起起始始位位点点，只只有有带带因因子子的的全全酶酶才才能能专专一一地地同同启启动动子子结结合合。RNA聚聚合合酶酶沿沿着着模模板板前前进进，直直到到终终止止子子，转转录录产产生生一一条条RNA链链。通通常常把把基基因因转转录录起起点点前前面面即即5端端的的序序列列称称为为上上游游(upstream)，起起点点后后面面即即3端端的的序序列列称称为为下下游游(downstream)。并并把把起起点点的的位位置置记记为为+1，下下游游的的核核苷苷酸酸依依次次记记为为+2，+3，上上游游方向依次记为方向依次记为-1，-2，-3，启动子结构启动

33、子结构 6/2/202364启动子结构启动子结构在在真真核核基基因因中中，有有少少数数基基因因没没有有TATA框框。没没有有TATA框框的的真真核核基基因因启启动动子子序序列列中中，有有的的富富集集GC，即即有有GC框框；有有的的则则没没有有GC框框。GC框框位位于于-80-110bp处处的的GCCACACCC或或GGGCGGG序序列列。TATA框框的的主主要要作作用用是是使使转转录录精精确确地地起起始始；CAAT框框和和GC框框则则主主要要是是控控制制转转录录起起始始的的频频率率，特特别别是是CAAT框框对对转转录录起起始始频频率率的的作作用用更更大大。在在真真核核生生物物中中，在在转转录录

34、起起始始位位点点上上游游70-80bp处处有有CAAT顺顺序序，也也称称为为CAAT盒盒，是比较保守的共有序列：，是比较保守的共有序列：GCCTCAATCT。6/2/202365DNA-蛋白质结合研究策略6/2/202366背景背景基基因因转转录录实实际际上上是是RNA聚聚合合酶酶、转转录录调调控控因因子子和和启启动动子子区各种调控元件相互作用的结果。区各种调控元件相互作用的结果。在在基基因因表表达达的的调调控控中中，转转录录的的起起始始是是关关键键。常常常常某某个个基基因是否应当表达决定于在特定的启动子起始过程。因是否应当表达决定于在特定的启动子起始过程。启启动动子子区区DNA结结合合蛋蛋白

35、白作作为为转转录录调调控控因因子子，通通过过与与启启动动子子DNA结结合合以以调调节节基基因因转转录录。犹犹如如抗抗原原-抗抗体体特特异异性性结结合合一一样样，蛋蛋白白质质与与DNA的的结结合合也也是是特特异异的的，这这是是研研究究启启动子区动子区DNA结合蛋白的前提。结合蛋白的前提。6/2/202367DNA-binding and activating functions in a transcription factor may comprise independent domains of the protein6/2/202368研究方案研究方案细细胞胞内内法法(in vivo):以

36、以已已知知启启动动子子DNA序序列列筛筛选选出出与与其其相相结结合合的蛋白编码基因的蛋白编码基因,通过生物信息分析来确定该蛋白质的名称。通过生物信息分析来确定该蛋白质的名称。优优点点：更更符符合合生生理理状状态态，操操作作简简便便，适适合合大大通通量量筛筛选选，用用于于寻找未知基因及蛋白质。寻找未知基因及蛋白质。缺缺点点：一一是是只只能能筛筛选选可可与与启启动动子子DNA特特异异性性结结合合的的蛋蛋白白质质，但不能检查出精确的蛋白质结合位点；二是特异性略差。但不能检查出精确的蛋白质结合位点；二是特异性略差。常常用用的的有有酵酵母母单单杂杂交交(Yeastonehybrid)技技术术、噬噬菌菌体

37、体表表面面展展示示(Phagedisplay)技术技术等。等。6/2/202369研究方案研究方案细细胞胞外外法法(in vitro)：即即在在体体外外用用重重组组的的已已知知蛋蛋白白质质与与启动子启动子DNA结合。结合。优优点点：特特异异性性好好，且且能能够够在在启启动动子子DNA序序列列上上找找到到精精确的蛋白质结合位点。确的蛋白质结合位点。缺缺点点：效效率率低低，操操作作复复杂杂，一一般般不不用用于于寻寻找找未未知知基基因因及蛋白质。及蛋白质。常用的有常用的有EMSA(electrophoreticmobility-shiftassay)、DNaseIfoot-printingassay

38、等。等。6/2/202370凝胶迁移率变动试验凝胶迁移率变动试验(EMSA)基基本本原原理理为为：在在凝凝胶胶电电泳泳中中，由由于于电电场场的的作作用用，小小分分子子DNA片片段段比比其其结结合合了了蛋蛋白白质质的的DNA片片段段向向阳阳极极移移动动的的速速度度快快。若若目目的的DNA与与特特异异性性蛋蛋白白质质结结合合，则则其其向向阳阳极极移移动动的的速速度度受受到到阻阻滞滞，在在凝凝胶胶放放射射性性自自显显影影上上或或生生物物素标记，就可找到素标记，就可找到DNA结合蛋白。结合蛋白。6/2/202371超级超级EMSA超超级级EMSA，即即Super-shiftassay,是是EMSA试试

39、验验的的改改进进，将将DNA与与更更多多的的蛋蛋白白结结合合，这这样样，与与特特异异性性蛋蛋白白结结合合的的目目的的DNA移移动动速速度度进进一一步步减减慢。慢。由由于于凝凝胶胶迁迁移移率率变变动动试试验验的的特特异异性性好好，常常用用来来鉴鉴定定其其它它方方法法筛筛选选出出的的结结果果。显显而而易易见见，克克隆隆启启动动子子DNA片片段段并并标标记记，用用该该实实验验就就可可找找到到相相应的结合蛋白。应的结合蛋白。6/2/202372EMSA优缺点优缺点优点：优点：简单、快速、敏感简单、快速、敏感缺点缺点:1.需需已知目标已知目标DNA序列序列2.DNA序列较短序列较短,一般为一般为20-3

40、0个核苷酸。个核苷酸。3.体外体外（非体内）检测方法（非体内）检测方法6/2/202373EMSAEMSA原理原理(a)ThebindingsiteofinterestissynthesizedasashortradiolabelledDNAprobewhichcanbeusedtoidentifybothknownandnovelfactorsbindingtothecandidateregion.OnceboundtoDNA,aproteinDNAcomplexisstabilizedwhensubjectedtonon-denaturingPAGE,allowingresolutiono

41、fproteinDNAcomplexesasdiscretebands.(b)Thespecificityoftheinteractionmaybeinvestigatedbycompetitionexperimentsinwhichtypically10-or100-foldexcessunlabelledprobeisadded,which,inthecaseofaspecificcompetitorprobe,resultsinprogressivelylessradiolabelledprobeboundbythetranscriptionfactorprotein.6/2/20237

42、4DNaseI足迹试验足迹试验足足迹迹试试验验（foot-printingassay）不不仅仅能能找找到到与与特特异异性性DNA结结合合的的目目标标蛋蛋白白，而而且且能能告告知知目目标标蛋蛋白白结结合合的的碱碱基基部部位位。足足迹迹试试验验的的方方法法较较多多，常常用用的的有有DNaseI足足迹迹试试验验、硫硫酸酸二二甲甲酯酯(dimethylsulfate,DMS)足迹试验足迹试验，二者原理基本相同。二者原理基本相同。基基本本原原理理：蛋蛋白白结结合合在在DNA片片段段上上，保保护护结结合合部部位位不不被被DNaseI破破坏坏，这这样样，蛋蛋白白质质在在DNA片片段段上上留留下下了了“足足迹

43、迹”，在在电电泳泳凝凝胶胶的的放放射射性性自自显显影影图图片片上上，相相应应于于蛋蛋白白质质结结合合的的部位没有放射性标记条带。部位没有放射性标记条带。6/2/202375Principle of the DNase I foot-printing assay(含乳糖操纵子DNA)(乳糖阻遏物)6/2/202376Principle of the DNaseI foot-printing assay6/2/202377DNaseI足迹试验足迹试验技术流程：技术流程：1.标标记记探探针针：待待检检双双链链DNA分分子子用用32P作作末末端端标标记记，通通常常只只标标记记一端。一端。2.结结合合和

44、和消消化化：蛋蛋白白质质与与DNA混混合合，待待二二者者结结合合后后，加加入入适适量量的的DNaseI以以消消化化DNA分分子子，控控制制酶酶的的用用量量，使使之之达达到到每每个个DNA分子只发生一次磷酸二酯键断裂，同时设未加蛋白质的对照。分子只发生一次磷酸二酯键断裂，同时设未加蛋白质的对照。3.电电泳泳和和显显影影：从从DNA上上除除去去蛋蛋白白质质，将将变变性性的的DNA加加样样在在测测序序凝凝胶胶中中作作电电泳泳和和放放射射性性自自显显影影，与与对对照照组组相相比比后后解解读读出出足足迹迹部位的核苷酸序列。部位的核苷酸序列。6/2/202378启动子区SNPs的功能研究6/2/20237

45、9背景背景p编码编码DNA(CodingDNA)：外显子：外显子(exons)氨基酸改变或转录氨基酸改变或转录mRNAp非编码非编码DNA(Non-codingDNA)：启动子：启动子(promoter)、内含子内含子(introns)、5-非翻译区非翻译区(5-UTR)、3-非翻译区非翻译区(3-UTR)基因表达基因表达(假定的调控区，假定的调控区，putativeregulatoryregions)转录转录(启动子区启动子区)6/2/202380背景背景如如果果SNPs发发生生在在DNA编编码码区区，可可引引起起翻翻译译蛋蛋白白质质的的氨氨基基酸酸发发生生改改变变，即即使使是是同同义义突突

46、变变(synonymousmutation)，该该SNPs的的功功能能效效应应也也可可在在mRNA水平检出。水平检出。如如果果SNPs发发生生在在非非编编码码区区，特特别别是是基基因因上上游游的的启启动动子子区区，则则可可能能影影响基因的转录过程。响基因的转录过程。如如果果SNPs位位于于某某转转录录因因子子的的共共有有序序列列中中，将将可可能能改改变变该该转转录录因因子子与与DNA结结合合的的亲亲和和性性(affinity),或或引引入入一一个个新新的的因因子子与与DNA结结合合，从而可能改变该基因转录过程的特异性和动力学特征。从而可能改变该基因转录过程的特异性和动力学特征。发发生生在在非非

47、编编码码区区的的SNPs的的功功能能效效应应难难以以直直接接检检出出，必必须须通通过过诸诸如如转转录活性试验等手段录活性试验等手段间接检测。间接检测。6/2/202381转录起始位点转录起始位点基基因因的的启启动动子子区区域域中中含含有有许许多多重重要要的的调调控控基基因因转转录录的的DNA序序列列（顺顺式式元元件件），若若要要阐阐明明基基因因在在转转录录水水平平上上的的调调控控机机制制（包包括括启启动动子子区区SNPs功功能能研研究究），克克隆隆启启动子序列是必不可缺的关键一环。动子序列是必不可缺的关键一环。到到目目前前为为止止，已已阐阐明明启启动动子子序序列列以以及及它它们们的的调调控控机

48、机制制的的基基因因数数量量非非常常有有限限。标标准准的的真真核核生生物物有有关关的的启启动动子子数数据据库库EukaryoticPromoterDatabase中中登登录录的的基基因因启启动动子子也也不不过过数数百百个个，其其中中一一个个重重要要原原因因之之一一是是许许多多基基因因未未能能确切的确定转录起始位点。确切的确定转录起始位点。6/2/202382转录起始位点转录起始位点o理理想想的的克克隆隆cDNA应应包包含含模模板板mRNA的的5帽帽的的结结构构以以及及3多多聚聚A尾的尾的全长序列。全长序列。o传传统统的的方方法法克克隆隆的的cDNA，多多数数情情况况下下其其5末末端端为为部部分分

49、缺缺失失状状态态。究其原因有二：。究其原因有二：n一一是是在在以以mRNA模模板板进进行行逆逆转转录录过过程程中中，逆逆转转录录酶酶在在从从模模板板mRNA中中脱脱落落，只能得到部分拷贝的，只能得到部分拷贝的cDNA产物。产物。n二二是是在在进进行行逆逆转转录录过过程程中中，用用了了部部分分5末末端端被被降降解解的的mRNA为为模模板板合合成成cDNA。因因此此，在在构构建建cDNA文文库库中中得得到到的的多多数数是是5末末端端部部分分缺缺失失状状态态的的cDNA。换换言言之之，在在构构建建cDNA文文库库的的过过程程中中，应应用用逆逆转转录录酶酶以以及及应应用用极极易易受受降降解解的的mRN

50、A是是不不可可避避免免的的，因因此此5末末端端部部分分缺缺失失就就不不足足为为奇了。奇了。6/2/202383转录起始位点转录起始位点S1核核酸酸酶酶作作图图法法、引引物物延延伸伸法法(RT)、5-RACE(rapidamplificationofcDNAends)法法等等传传统统的的转转录录位位点点的的确确定定方方法法，技技术术要要求求比比较较高高，且且有有时时由由于于种种种种原原因因，难难以以确确定定确确切切的的转转录录起始位点。起始位点。随随着着生生物物信信息息学学（Bioinformatics)的的发发展展，网网上上的的相相关关数数据据库库逐逐渐丰富，这为转录起始位点

展开阅读全文