《蛋白质组学技术精选PPT.ppt》由会员分享,可在线阅读,更多相关《蛋白质组学技术精选PPT.ppt(66页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、关于蛋白质组学技术第1页,讲稿共66张,创作于星期三一、前言人类基因组序列图谱初稿的公布,在揭示基因组的精细结构的同时,也凸现出基因数量有限性和基因结构的相对稳定性,这与生命现象的复杂性和多变性之间存在着巨大反差。这种反差促使人们认识到:基因只是遗传信息的载体。要研究生命现象,阐释生命活动的规律,只了解基因组的结构是远远不够的,这也使得人们对于生命活动的直接执行者蛋白质的重要性有了更深刻的理解,因此,对蛋白质的数量、结构、性质、相互关系和生物学功能进行全面和深入的研究,成为生命科学研究的追切需要和重要任第2页,讲稿共66张,创作于星期三 务。一个以“蛋白质组”(proteome)为研究重点的生
2、命科学新时代已悄然到来。二、蛋白质组学的概念及其发展史随着后基因组时代的到来,蛋白质组研究越来越受到国内外科学工作者的密切关注,并以其特有的思维方法和技术手段在解决生物学重大问题上开始显示出强大威力。可以相信,随着蛋白质组研究的不断深入,它在揭示生长、发育、凋亡、分化、信号传导和代谢调控等生命活动的规律上将会有新突破,对探讨重大疾病的发生机制、疾病的诊断防治和新药开发将提供重要的理论基础。第3页,讲稿共66张,创作于星期三(一)蛋白质组学的概念(一)蛋白质组学的概念“蛋白质组”一词的英文是PROTEOME,它由PROTEins和genOME两个词组合而成,意思是proteins express
3、ed by a genome,即基因组表达的蛋白质。广义上讲,蛋白质组(proteome)是指“一个细胞或一个组织基因组所表达的全部蛋白质”。它是对应于一个基因组的所有蛋白质构成的整体,而不是局限于一个或几个蛋白质。由于同一基因组在不同细胞、不同组织中的表达情况各不相同,即使是同一细胞,在不同的发育阶段、不同的生理条件甚至不同的环境影响下,其蛋白质的存在状态也不尽相同。因此,蛋白质组是一个在空间和时间上动态变化着的整体。第4页,讲稿共66张,创作于星期三蛋白质组学(proteomics)是指应用各种技术手段来研究蛋白质组的一门新兴学科,其目的是从整体的角度分析细胞内动态变化的蛋白质组成成分、表
4、达水平与修饰状态,了解蛋白质之间的相互作用与联系,提示蛋白质功能与细胞生命活动规律。要对“全部蛋白质”进行研究是非常困难的,“功能蛋白组学(functional proteomics)”的提出解决了这一难题,其研究对象是功能蛋白质组,即细胞在一定阶段或与某一生理现象相关的所有蛋白质,它是介于对个别蛋白质的传统蛋白质化学研究和以全部蛋白质为研究对象的蛋白质组学研究之间的层次,并把目标定位在蛋白质第5页,讲稿共66张,创作于星期三群体上,这一群体可大可小,从局部入手研究蛋白质组的各个功能亚群体,以便将来把多个亚群体组合起来,逐步描绘出接近于生命细胞的“全部蛋白质”的蛋白质组图谱。功能蛋白质组学的研
5、究为实际运作带来方便,人们可利用现有的技术手段来研究蛋白质组这一极限群体中的各蛋白质功能亚群,从理论和技术上使以“全部蛋白质”为研究对象的蛋白质组学这一抽象概念具体化,使研究者们更易于从时、空、量效方面动态、整体、深入地研究生理状态下同一组织细胞在不同发育阶段或同一组织细胞在不同个体间或同一基因组在不同组织细胞间,以及病理情况下同一第6页,讲稿共66张,创作于星期三疾病的不同发展阶段的蛋白质表达模式和功能模式的变化,揭示一些重要的生命现象和一些重大疾病的发生发展规律。狭义上讲,蛋白质组是指不同条件下细胞内蛋白质的变化,比如正常细胞和异常细胞之间,细胞用药和不用药之间的蛋白质表达谱的差别,这在疾
6、病研究和药物筛选上很有意义,是目前蛋白质组学在应用研究方面最具前景的领域。当然,随着蛋白质组研究的不断发展,蛋白质组学的概念也将不断发展和深化。(二)蛋白质组学的产生与发展(二)蛋白质组学的产生与发展20世纪中期以来,随着DNA双螺旋结构的提出和蛋白质空第7页,讲稿共66张,创作于星期三间结构的X射线解析,开始了分子生物学时代,对遗传信息载体DNA和生命功能的主要体现者蛋白质的研究,成为生命科学研究的主要内容。20世纪90年代初期,美国生物学家提出并实施了人类基因组计划,经过各国科学家多年的努力,人类基因组计划取得了巨大成绩,一些低等生物的DNA序列已被阐明,人类DNA序列的框架图已经测定,迄
7、今已测定的表达序列标签(EST)几乎覆盖了人类所有基因。在这样的形势下,生命科学已进入了后基因组时代。在后基因组时代,生物学研究的重点已从揭示生物所有遗传信息转移到在整体水平上对生物功能的研究。这种转向第8页,讲稿共66张,创作于星期三的第一个标志就是产生了一门称为功能基因组学的新学科。功能基因组学的主要任务是解析和综合大量的遗传信息,阐明基因遗传信息与人类生命活动之间的联系。基因的功能是通过其产物mRNA和蛋白质来体现的。近年来利用基因表达连续分析(SAGE)、微阵列(microarray)和DNA芯片(chip)等新技术研究mRNA水平上的基因活动规律取得了较大进展。但mRNA水平的基因表
8、达状况并不能完全代表蛋白质水平的状况,mRNA与蛋白质间的相关系数仅为0.4-0.5,蛋白质才是生命功能的主要执行者,由于它存在着翻译后的加工修饰、转移定位、构象变化、第9页,讲稿共66张,创作于星期三蛋白质与蛋白质及蛋白质与其他生物大分子相互作用等自身特点,因此难以从DNA和mRNA水平得到解答,从而促使人们从组织或细胞内整体蛋白质的组成、表达和功能模式去研究生命活动的基本规律。自1994年澳大利亚学者Williams和Wilkins首先提出与基因组相对应的“蛋白质组”概念,并开始从整体蛋白质水平研究生命现象以来,蛋白质组研究在国际上进展十分迅速,不论是基础理论,还是技术方法,都在不断地进步
9、和完善。许多种细胞的蛋白质组数据库已经建立,相应的国际互联网站也层不出穷,众多的制药厂和公司在巨大财力的支持和商业利益的诱惑下第10页,讲稿共66张,创作于星期三纷纷加入蛋白质组研究领域,蛋白质组研究的文章每年成倍增长。1996年澳大利亚建立了世界上第一个蛋白质组研究中心(Australia proteome analysis facility,APAF)。在政府部门的大力支持下,丹麦、加拿大也先后成立了蛋白质组研究中心。1997年召开了第一次国际“蛋白质组学”会议,预测21世纪生命科学的重心将从基因组学转移到蛋白质组学,为生命科学和医药学领域的研究带来了新的生机。1998年在美国旧金山召开了
10、第二届国际蛋白质组学会议,参加者大都来自各大药厂和公司。1999年1月在英国伦敦举行了应用蛋白质组会议。1999年5月在日本召开的第11页,讲稿共66张,创作于星期三国际电泳会议上,约1/3的文章与蛋白质组有关。目前,中国国家自然科学基金委员会关于蛋白质组重大项目的研究已启动,肿瘤蛋白质组研究也已列入我国973和863项目。中国科学院上海生物化学研究所、中国军事医学科学院、湖南师范大学、中南大学湘雅医学院等单位相继开展了蛋白质组学研究。1998年在中国科学院上海生物化学研究所举办了两次全国性的蛋白质组学研讨会,并在此基础上,提出了功能蛋白质组学的研究战略。可以相信在不久的将来,“人类蛋白质组计
11、划”必将启动,而且规模比“人类基因组计划”更大,产生的影响更久远,将是继基因组研究之后的又一“大科学”。第12页,讲稿共66张,创作于星期三三、蛋白质组学技术方法概述三、蛋白质组学技术方法概述蛋白质组学主要涉及有两方面的内容:一是研究蛋白质组的组成成份,即蛋白质组表达模式的研究;二是研究蛋白质组的功能,即蛋白质组功能模式的研究,目前主要集中在蛋白质组表达模式方面。蛋白质组表达模式研究的支撑技术主要有双向凝胶电泳和以质谱为代表的蛋白质鉴定技术及生物信息学。双向凝胶电泳(2-DE)技术于1975年由OFarrell等创立,其原理是第一向在高压电场下对蛋白质进行等电聚焦(IEF),再在第一向垂直方向
12、上进行第二向SDS-聚丙烯第13页,讲稿共66张,创作于星期三酰胺凝胶电泳(SDS-PAGE)。等电聚焦电泳由最初的载体两性电解质管胶电泳发展到目前的固相pH梯度(IPG)凝胶电泳,由于采用了IPG胶条从而避免了因载体两性电解质引起的聚焦时间延长、pH梯度不稳定、阴极漂移等现象。目前IPG双向凝胶电泳的分辨率达到了1万多个蛋白质点,但对过于偏酸或偏碱、高分子质量、极微量蛋白质以及难溶性蛋白质的分辨仍感困难。由于双向凝胶电泳对批量蛋白质可实现一次性分离,具有高灵敏度的高分辨率、便于计算机进行图像分析处理、可以很好地与质谱分析等鉴定方法匹配的优点,因而成为目前分离蛋白质组分的核心技术。此外,双向高
13、效柱层析、毛细管电泳也是分第14页,讲稿共66张,创作于星期三离蛋白质组分的有效技术。对分离的蛋白质进行鉴定是蛋白质表达模式研究的又一重要内容,通常采用的有蛋白质微量测序、氨基酸组成分析等传统的蛋白质鉴定方法,但这些方法费时、费力、不易实现高通量分析。因此一种新的蛋白质鉴定技术质谱(MS)法受到了人们的重视和应用,其基本原理是样品分子离子化后,根据离子间质荷比(m/z)的差异来分离并确定样品的分子质量。质谱在20世纪初就已经产生,多用于无机物或小分子有机物的鉴定,直到80年代末随着“软电离”技术的出现而进入生物大分子(如蛋白质)的鉴第15页,讲稿共66张,创作于星期三定领域。所谓“软电离”是指
14、样品分子电离时保留整个分子的完整性,不会形成碎片离子。软电离质谱用于大分子的鉴定,主要有以下特点:灵敏度高、快速、能同时提供样品的精确分子质量和结构信息、既可定性又可定量、并能有效地与各种色谱联用,如用HPLC/MS来分析复杂体系。目前用于蛋白质鉴定的质谱主要有两种:电喷雾质谱(ESI-MS)和基质辅助激光解吸/电离飞行时间质谱(MALDI-TOF-MS)。但要精确鉴定某一蛋白质通常还得联合几种鉴定技术。最近,国处建立了一种将MALDI-MS技术直接用于组织切片或印片的方法(Pierre C et al,1999),即组织切片或印片原位质谱分析技术,取得了较第16页,讲稿共66张,创作于星期三
15、满意的结果。生物信息学是随着人类基因组计划、计算机技术、网络技术的发展而诞生的一门新兴学科,是蛋白质组学的一个重要的技术平台。生物信息学是蛋白质组学研究的一个不可缺少的部分,其在蛋白质组学中的研究有两个重要应用:一是构建和分析双向凝胶电泳图谱,二是数据库的搜索与构建。目前应用最普遍的数据库是NRDB和dbEST数据库。NRDB由SWISS-PROT和GENPETP等几个数据库组成。蛋白质功能模式的研究是蛋白质组研究的最终目标,其主要研究目标是要揭示蛋白质组成员间的相互作用、相互协第17页,讲稿共66张,创作于星期三调的关系。并深入了解蛋白质的结构与功能的相互关系,以及基因结构与蛋白质结构功能的
16、关系。目前,蛋白质功能模式研究的主要技术有酵母双杂交系统、噬菌体展示、生物传感芯片质谱、基因工程和蛋白质工程中的突变表达分析、磁共振成像、X线晶体衍射分析、蛋白质芯片技术等。四、蛋白质样品制备技术四、蛋白质样品制备技术蛋白质组是指某种细胞或组织中基因组表达的全部蛋白质。实践中更多的情况是研究功能蛋白质组,即细胞在某一特定阶段或某一生理状态下基因表达的所有蛋白质。由于蛋白质组研究是对不同时间和不同空间发挥功能的蛋白质整体的研究,因此如何从细胞组织中尽可能完整地将蛋白质以溶解状态提取出来,是蛋白质组研究的首要步骤。第18页,讲稿共66张,创作于星期三(一)蛋白质制备常用技术(一)蛋白质制备常用技术
17、在蛋白质制备中主要包括细胞组织的破碎裂解;蛋白质增溶溶解以破坏蛋白质与蛋白质分子之间,蛋白质与非蛋白质之间的共价与非共价相互作用;变性及还原;去除非蛋白质组分,如核酸、脂类等。为了达到这一目的,在蛋白质制备过程中需使用表面活性剂、还原剂及离液剂。离液剂、还原剂及表面活性剂的选择离液剂、还原剂及表面活性剂的选择(1)离液剂()离液剂(chaotropes)最普遍的离液剂是脲,脲的作用主要是改变或破坏氢键等次级键的结构,使蛋白质的肽链伸展开来,充分暴露疏水第19页,讲稿共66张,创作于星期三中心,降低接近疏水残基的能量域,但通常当脲和表面活性剂CHAPS联合使用时,会使某些蛋白质吸附在固相pH梯度
18、凝胶中而丢失。因此,近年常将一种新的离液剂硫脲和脲联合使用,以增加蛋白质在IPG胶中的溶解性。硫脲的使用大大改善了蛋白质的溶解性能,特别是改善了膜蛋白的提取。但硫脲在水中溶解性差,需用高浓度的脲助溶。(2)表面活性剂)表面活性剂蛋白质在去折叠后,会暴露出大量疏水性残基,因此常需使用表面活性剂破坏蛋白质分子之间的疏水相互作用。常使用的表面活性剂有阴离子去污剂SDS,非离子去污剂第20页,讲稿共66张,创作于星期三Triton X-100和NP-40,两性离子去污剂CHAPS等。(3)还原剂)还原剂在蛋白质制备中常需要断裂蛋白质分子中的二硫键,以利于肽链的分离,因此样品还原的好坏也会影响到蛋白质的
19、分离效果。一般使用-疏基乙醇和二硫苏糖醇(DTT)作还原剂,但DTT本身带有电荷,在等电聚焦时,常常会迁移到pH范围以外,从而使某些蛋白质的二硫键重新配对,使溶解度降低而重新沉淀下来。采用非离子型还原剂如三丁基膦(TBP)可大大增加蛋白质的溶解性,并可帮助蛋白质从第一向转移到第二向。第21页,讲稿共66张,创作于星期三(二)肿瘤样品蛋白质的抽提(二)肿瘤样品蛋白质的抽提肿瘤蛋白质组学研究主要是为了建立肿瘤细胞和组织的蛋白质表达谱及研究肿瘤细胞和组织与正常细胞和组织之间差异表达的蛋白质,以期发现用于肿瘤诊断、预后和治疗的分子标志物。如何制备优良的肿瘤样品蛋白质是肿瘤蛋白质组学研究的首要问题。由于
20、蛋白质在类型和特性上均存在着很大的差异,因此不同的蛋白质样品的抽提方法也各异。但无论何种抽提方法最终都是使蛋白质能充分溶解、解聚、变性和还原,使期能得到更好的分离和鉴定。常用的组织裂解液配方(用于双向电泳)为9.8mol/L脲、第22页,讲稿共66张,创作于星期三2%(W/V)NP-40、1%(V/V)TritonX-100、100mmol/L DTT、0.5mmol/L PMSF、4%CHAPS、0.5mmol/L EDTA、40mmol/L Tris、1g/mL aprotinin、10g/mL chymostatin、2%(V/V)pharmalyte。肿瘤组织蛋白质抽提的一般步骤:(1
21、)将已经处理过的样品从-80冰箱中取出,各自称重(湿重30-80mg),于液氮中充分研磨至粉末状。(2)组织研磨后置于400L裂解液中,充分旋涡混匀。(3)悬液置于37 孵育1h。(4)悬液取出后再充分旋涡,于低温冷冻离心机12000g、第23页,讲稿共66张,创作于星期三离心15min(温度控制在8-12)。(5)吸取上清液即为组织的总蛋白质。(6)进行蛋白质的定量检测,确定上样量。五、蛋白质组双向凝胶电泳分离技术五、蛋白质组双向凝胶电泳分离技术蛋白质组学研究技术主要由双向凝胶电泳(two-dimensional electrophoresis,2-DE)、微量蛋白质化学及生物信息学三个部分
22、组成。1975年OFarrell等建立了双向凝胶电泳技术(OFarrell,1975),第一向是等电聚焦(isoelectric focusing,IEF),第二向是SDS聚丙烯酰胺凝胶电泳(SDS-PAGE)。第一向的IEF电泳,经历了从第24页,讲稿共66张,创作于星期三最初的载体两性电解质pH 梯度等电聚焦电泳到20世纪80年代固相pH梯度等电聚焦电泳(immobilized pH gradient,IPG)的发展过程。尽管传统的OFarrell系统双向电泳有较高的分辨率,曾报道可以分离到约1000多种蛋白质,但这种系统仍存在不少问题,如重复性差,特别是第一向因阴极漂移而丢失碱性蛋白质,
23、载体两性电解质pH梯度不稳定,受电场和时间影响大,脲在低温下容易在毛细管中析出影响聚合及蛋白质分离等。1982年由Bjellgvist等发展并完善了固相pH梯度等电聚焦技术,Goeg(1997)等成功地将之应用于双向电泳的第一向分离,从而解决了以上第25页,讲稿共66张,创作于星期三存在的问题,大大提高了双向电泳的分辨率及重复性。在一张双向电泳图谱上已可以分离到近万个蛋白质点,这是目前分离蛋白质的最好方法,因此已成为蛋白质组学研究不可缺少的核心技术。目前Pharmacia公司推出2DE-MS自动化系统以及大通量的2-DE技术,在第二向电泳中发展了6-12块胶同时电泳的Ettan系统,从而加快电
24、泳速度和电泳的重复性,并推出了自动取点、酶解,以使2-DE胶上所有样品的酶解和转移能平行化进行。亚蛋白质组阵列重叠群技术:亚蛋白质组阵列重叠群技术:由于蛋白质溶解性、丰度等的差异,要在单一2-D胶上展现所有的蛋白质仍存在困难。第26页,讲稿共66张,创作于星期三为了研究整个蛋白质组,必须采用亚蛋白质组阵列策略。该策略以重叠群技术为基础。即首先将组织细胞分成不同的亚细胞组分或顺序分级抽提具有不同溶解度范围的蛋白质亚群,用宽pH范围的2-D胶检测样品的复杂性,再用一套具有交叉重叠的高分辨、高上样量的窄pH范围IPG等电聚焦和用不同浓度的SDS-PAGE胶进行分离,最后在计算机上根据重叠群的原理进行
25、拼接和分析,从而显示蛋白质组中几乎所有的组分,这类方法能有效分离低丰度蛋白质,pI与分子质量非常接近的蛋白质,并能大致确定分离蛋白质的亚细胞定位。第27页,讲稿共66张,创作于星期三(一)固相(一)固相 pH梯度梯度-SDS双向凝胶电泳(双向凝胶电泳(IPG-DALT)方法)方法1、固相、固相pH梯度等电聚焦凝胶电泳(第一向)梯度等电聚焦凝胶电泳(第一向)准备胶条架样品处理放置IPG胶条水化及聚焦电泳平衡2、SDS聚丙烯酰胺凝胶电泳(第二向)聚丙烯酰胺凝胶电泳(第二向)凝胶配制及灌胶第28页,讲稿共66张,创作于星期三第一向胶条的转移电泳脱胶染色六、双向凝胶电泳图像分析六、双向凝胶电泳图像分析
26、PDQUEST分析2-D图像的基本流程:获取图像切割与定位图像蛋白质斑点检测蛋白质斑点匹配数据分析。七、蛋白质鉴定技术七、蛋白质鉴定技术(一)概述(一)概述第29页,讲稿共66张,创作于星期三蛋白质组研究中对于通过双向电泳或其他方法分离的蛋白质样品进行鉴定(identification)或称注释(annotation)是蛋白质组研究中最为关键的一步。分析鉴定蛋白质的方法从20世纪早期Stein和Moore开创的氨基酸组成分析算起,经过了大半个世纪的发展,建立了一系列方法技术包括蛋白质N端、C端序列测定,等电点,分子质量的测定,肽谱分析鉴定技术等。但目前蛋白质组学研究中的蛋白质鉴定技术与传统方法
27、相比,至少有以下三个特点:其一,蛋白质组学研究中对鉴定方法的灵敏度比传统方法有更高的要求,一个双向凝胶上的蛋白质点的量通常只有几第30页,讲稿共66张,创作于星期三个或不到一个皮摩尔(pmol),鉴定方法的灵敏度必须高于这一要求。其二,传统方法通常都是对个别和几个蛋白质进行分析鉴定,而蛋白质组研究中要求同时对几十个、几百个甚至上千个蛋白质进行鉴定,因而对鉴定方法的通量和速度的要求要大大超过传统方法。目前蛋白质组学研究中的蛋白质鉴定技术的第三个特点是将实验结果与数据库查寻紧密关联。随着人类基因组计划而建立起来的人类基因组数据库和相关蛋白质数据库及相应的分析查寻软件,是目前人类疾病相关的蛋白质组研
28、究必不可少的手段。所谓对蛋白质组研究中展现的蛋白质进行鉴定或注释,就第31页,讲稿共66张,创作于星期三是把展现的某个蛋白质点或一个组分的名称和它在数据库中的进入名码(accession code)确定下来,或者鉴定出其是否为数据库中未曾鉴定过的新蛋白质。某种意义上说,注释和鉴定是将蛋白质氨基酸序列与基因的DNA序列联系起来。如果该种基因编码的蛋白质有已知的确定的功能,那么注释和鉴定则可把蛋白质氨基酸序列与其生物学活性联系起来,这也是蛋白质组研究最重要的目的之一。(二)质谱技术(二)质谱技术质谱仪一般由进样器、离子化源、质量分析器、离子检测器、控制电脑及数据分析系统组成,其中离子化源和质量第3
29、2页,讲稿共66张,创作于星期三分析器是两个关键的部件,用于生物大分子研究的质谱仪的离子化源主要是电喷雾(ESI)和基质辅助激光解吸附离子化源(MALDI),而质量分析器则主要有四级杆,离子肼和飞行时间三种。当前市面上质谱仪中ESI源多与四级杆,离子肼质量分析器相匹配,而MALDI源常与飞行时间质量分析器相匹配。当前在蛋白质组研究中用质谱技术鉴定和注释蛋白质主要通过两种路线,一种是通过肽质谱指纹图(peptide mass fingerprinting)和数据库搜寻匹配的路线,进行这种分析的质谱仪首选是MALDI-TOF质谱仪;另一种是通过测出第33页,讲稿共66张,创作于星期三样品中部分肽段
30、二级质谱信息或氨基酸序列标签与数据库搜寻匹配的路线,适合于进行这种分析的仪器主要是电喷雾串联质谱仪。由于当前蛋白质组研究中2-D胶电泳仍然是分离蛋白质的主导技术,对2-D胶上蛋白质点的鉴定,目前普遍认为MALDI-TOF质谱仪进行肽质谱指纹图(PMF)分析是合适的第一步。而MALDI-TOF质谱仪由于其灵敏度高(可达fmol),分析速度快,谱图易于解析以及受缓冲液/盐分的干扰小等诸多优点,非常适合于进行PMF分析。然而单靠PMF路线来鉴定蛋白质并非总能获得成功,经常第34页,讲稿共66张,创作于星期三有获得的肽质谱指纹图在数据库中得不到可靠的匹配的情况。其可能的原因有:由于样品量太少,PMF图
31、的信噪比太低、因而输入库中搜寻的数据质量不好。2-D胶上所取的一个蛋白质点并非单一蛋白质,所获得的PMF图实际上是两个以上蛋白质PMF图的混合图。操作中角蛋白或其他蛋白质的污染。该蛋白质发生了较多的转译后修饰,数据库中未有记载。所用胰蛋白酶质量不够好,蛋白酶自融片段多。所分析的蛋白质是一个数据库中没有的未知的新蛋白质。有些生物材料的蛋白质数据库规模太小。在上述情况下PMF方法未能鉴定的蛋白质可通过其第35页,讲稿共66张,创作于星期三他质谱技术获得该蛋白质一段或数段多肽的串联质谱信息或序列标签(Sequence tag)并将其输入数据库中进行搜寻来鉴定该蛋白质。(三)基质辅助激光解吸电离技术(
32、三)基质辅助激光解吸电离技术(MALDI)在质谱分析中,为了测定待测物分子的质量,首先必须在系统中导入能量,而能量的导入必须满足以下两点要求:第一,能量能有效并受控制地转换到样品中以使样品分子充分地解吸附并离子化;第二,为避免热不稳定性物质的热降解,能量必须在非常短的时间内导入。激光具有脉冲短、灵敏度高的特点,是一种较理想的能量导入方式。早第36页,讲稿共66张,创作于星期三在20世纪60年代初期,激光就被科学工作者用来在质谱分析中产生离子,他们将具有不同波长和不同脉冲宽度的激光与各种不同类型的质谱结合进行研究。20世纪70年代初期首次用激光产生有机分子离子,但在20年以后,激光才用于大分子物
33、质的解吸和电离。这一突破性的进展关键在于基质辅助激光解吸离子化技术的创立。在基质辅助激光解吸电离技术中,采用了一种小分子物质即基质帮助大分子物质进入气相。当基质以较高的比例与样品混合后,高分子待测样品便以单分子状态均匀地分散于基质中,在所采用的激光波长下,由于基质对激光有较第37页,讲稿共66张,创作于星期三强的吸收,而待测物只吸收很弱的激光,故不会造成大分子物质的破坏和降解。当大量被激发的基质分子由于热释放而挥发时,会同时将非挥发性的大分子待测物质带入气相。基质的加入使得除待测物基质以外的分子之间的相互作用减少,因而降低了解吸能,解决了大分子物质的汽化问题。基质在MALDI-TOF-MS方法
34、中的作用主要包括三个方面:第一,从激光光源吸收能量以防止被测大分子物质的分解;第二,使被测物分子分离成单分子状态以防止它们聚集;第三,在被测物离子化过程中充当质子化试剂。第一第38页,讲稿共66张,创作于星期三条作用要求基质对激光光源有很强的吸收,到目前为止文献报道的基质化合物均为含苯环的有机化合物;第二条作用要求基质与被测分子物质具有很好的相容性,同时不能有分子间的相互作用;第三条作用要求基质为酸性物质。基质化合物视其物理状态的不同可分为固态基质和液态基质两 大类,其中固态基质用于大分子分析时具有较好的分辨率,而液态基质用于大分子分析时需要用较高强度的激光来产生离子,容易导致碎片离子的产生,
35、因此一般不用于大分子质量物质的测定。鉴于以上三条要求,基质化合物通常选用固体状态的弱有机酸,常用的基质化合物有第39页,讲稿共66张,创作于星期三2,5-二羟基苯甲酸(DHB),-氰基-4-羟基肉桂酸(CCA),3,5-二甲氧基-4-羟基肉桂酸或称芥子酸(SA)等。对于不同物质的测定,合适基质的选择是至关重要的,因为不同的物质其气化能力有所不同,而基质的吸热能力也有强弱之分。DHB适合于蛋白质、多肽、低聚糖、脂以及合成多聚物的测定,CCA适合于分子质量较小的蛋白质和多肽的测定,SA则一般用于分子质量较大的蛋白质的测定。(四)飞行时间质谱(四)飞行时间质谱(TOF-MS)飞行时间质谱主要由离子源
36、(ion source),质量分析器第40页,讲稿共66张,创作于星期三(mass analyzer)以及离子检测器(ion detector)组成。1、离子源MALDI离子源包括激光脉冲发生器、可调衰减器、聚焦调节光学系统等三个主要部分。离子源中用来完成基质辅助激光解吸电离最关键的参数是激光打在样品上的照射强度,蛋白质样品产生离子的最小值(阈值)大约为1MW/cm2。2、质量分析器飞行时间分析器是最简单的质量分析装置之一,它是基于对一套离子施加能量使其到达检测器来测定它们到达的时第41页,讲稿共66张,创作于星期三间。离子到达检测器的时间(t)与其在分析器中的飞行速度(v)密切相关(t=v/
37、d),由于飞行距离(d)是一定的,因而飞行时间t取决于它们的飞行速度(v)。而飞行速度又与离子质量(m)所带电荷(e)以及动力学能量(E)有关,由于动力学能量E=1/2mv2,故v=(2E/m)1/2,这即表明当具有不同质量(m)的离子被施加同样的能量(E)时,质量小的离子飞行速度会快一些,而质量大的离子飞行速度则慢一些,因而不同质量的离子到达检测器的时间就会出现不同。这个过程类似于某个人用同样的力量向同一个目标抛设两个相同体积的铁球和塑料球,结果塑料球由于质量较小,速度较快将会先于铁球到达目的地。第42页,讲稿共66张,创作于星期三3、离子检测器由基质辅助激光解吸电离产生的高质量的离子必须在
38、转换电板上转换成电子或低质量的离子才能得到检测。(五)(五)MALDI-TOF质谱测定肽质量指纹图(质谱测定肽质量指纹图(PMF)每种蛋白质或肽都有着自身特定的一级结构,即氨基酸序列,蛋白质或肽被酶解后所产生的肽片段也各具特性。因此,当蛋白质或肽被特异性的酶如Trpysin,Lys-C等酶切后再进行肽混合物质量测定,会得到一套具有特征性的肽质量图,称为肽质量指纹图(peptide mass fingerprinting,PMF)。正如人的指纹能辨明一个人的身份,肽质量指纹第43页,讲稿共66张,创作于星期三图也能鉴定该蛋白到底属于哪一种蛋白质。具体来说,要鉴定一个2-D胶上蛋白质点一般需要经过
39、:蛋白质原位酶解,MALDI-TOF肽质量指纹图测定,蛋白质鉴定数据库搜寻三个主要步骤。1、蛋白质原位酶解取点与脱色还原和烷基化酶解与萃取2、MALDI-TOF肽质量指纹图基质的选择与制备第44页,讲稿共66张,创作于星期三样品盘的清洗与样品制备质谱测定制备好的样品可使用各公司生产的不同类型的MALDI-TOF质谱来进地肽质量指纹图测定。仪器操作时一般需要选择下列参数:线性或反射模式,离子源加速电压及导出电压,紫外或红外激光波长,离子延迟抽取时间,飞行管道达到的真空度,质谱信号单次扫描累加次数,正离子或负离子谱测定。数据校正3、蛋白质鉴定数据库搜寻第45页,讲稿共66张,创作于星期三当获得蛋白
40、质点的准确肽质量指纹数据后,接下来的工作就是将该套肽片段数据输入数据库进行搜寻以确定蛋白质的最后归属。由于蛋白质组研究已日趋国际化,通过因特网可以方便、快捷、有效地交换和共享信息资源。目前因特网上有很多专门用于生命科学研究领域的WWW服务网站,其中ExPASY(蛋白质分析专家系统)是蛋白质组研究经常访问的一个网站,从它可以链接到各种相关数据库。八、生物信息学与蛋白质组信息学八、生物信息学与蛋白质组信息学第46页,讲稿共66张,创作于星期三生物信息学是生命科学和信息科学以及数学等学科交叉、结合的产物,它的诞生极大地推动了生命科学研究的进展。诺贝尔奖获得者W.Gilbert在1991年曾经指出:“
41、传统生物学解决问题的方式是实验的。现在,基于全部基因都将知晓,并以电子操作的方式驻留在数据库中,新的生物学研究模式的出发点应是理论的。一个科学家将从理论推测出发,再回到实验中去,追踪或验证这些理论假设。”因此,在未来的科研工作中,科学家第47页,讲稿共66张,创作于星期三们可能首先是从生物信息学的角度入手寻找自己感兴趣的生物学对象,然后回过头来进行实验操作以证明已有的科学知识或发现新的科研领域。随着人类基因计划的顺利实施,人们的注意力已从基因组测序转向对基因组表达的功能产物进行分析,即对蛋白质组进行结构与功能的分析,因此蛋白质组信息学已成为当前生物信息学面临的主要课题。(一)(一)生物信息学概
42、述生物信息学概述第48页,讲稿共66张,创作于星期三随着人类基因组计划的快速推进,生物信息学逐渐受到人们的重视。这主要有两个原因:首先是计算机科学本身的快速发展,导致了计算能力的迅速提高;另一个则是随着人类基因组研究逐渐深入,核酸和蛋白质数据的快速积累,导致对生物信息学的渴望急骤增加,目前这一领域内集中了来自数学、生物学、计算机专业等方面的人才。在此,对生物信息学的定义、工作方式及其诞生等做一简单介绍。第49页,讲稿共66张,创作于星期三1、生物信息学的定义、生物信息学的定义20世纪90年代初,美籍学者林华安(Hwa A.Lim)首先创造和使用了生物信息学(bioinformatics)一词。
43、对于生物信息学的定义,不同领域内的人有不同的提法,因此至今尚无一个明确、简单的定义。目前比较多的学者认为生物信息学是由于生命科学和计算机科学的迅速发展、相互交叉融合而衍生出来的一门新兴的边缘学科。它通过对生物学的实验数据进行获取、加工、存储、检第50页,讲稿共66张,创作于星期三索与分析,进而达到揭示数据中所蕴含的生物学意义的目的。虽然生物信息学这一名词创立于20世纪90年代初期,但其萌芽最早可追溯至20世纪60年代。早在1956年,便有人在美国田纳西州召开了名为“生物学中的信息理论讨论会”,而就其发展而言,却是一门相当年轻的学科。因此,无论从理论上来讲还是从现实情况来看,它的诞生和发展都是应
44、时代所需,是历史的必然。2、生物信息学的诞生、生物信息学的诞生第51页,讲稿共66张,创作于星期三20世纪后半叶,生命科学与分子生物学研究取得重要进展,特别是DNA测序技术的进步、人类基因组计划(human genome project,HGP)的实施,人类迅速积累了大量的DNA序列数据。对此,传统的研究方法难以快速消化这些数据产生新的知识。在这种强大的数据压力之下,人们开始探索采用新的数据分析方法来解决这一难题。与此同时,计算机技术的网络技术进入了快速发展阶段,人类的计算能力、信息传递与交互能第52页,讲稿共66张,创作于星期三力得到了极大的提高,为解决这一难题提供了基本条件。人们的注意力逐
45、渐聚焦到生物信息学,即通过计算机、网络技术来解决生物学中的信息问题。3、生物信息学的工作方式、生物信息学的工作方式生物信息学既然主要是利用计算机的网络开展工作,当然其工作方法离不开计算机的内容,比如数据库、软件、算法、分部式计算等等。数据库,顾名思义就是数据的集合,也是生物信息学工作的起点。目前,多数人第53页,讲稿共66张,创作于星期三都是通过互联网来访问远程数据库系统。随着数据库的界面越来越友好,已能够很容易地进行数据库查询等操作。软件则是用户面临的主要操作对象,一般生物信息学软件的获得主要有以下几种方法:利用现有的免费或商业软件,安装在本地计算机上进行使用。免费软件通常可以在互联网上找到
46、,并且下载,但服务上不及商业软件那样及时、便利。商业软件的好处是有相应的安装与维护,使用时有相应的说明可以参照进行,但第54页,讲稿共66张,创作于星期三费用比较昂贵。对于免费软件,在安装使用之前最好先阅读软件作者编写的帮助文档或使用说明之类的文件,以免安装使用过程中走弯路。通过互联网浏览器程序、软件客户端程序或E-mail电子邮件程序向远程服务器发送计算请求,软件服务器端程序将在远程服务器上进行计算,然后将计算结果返回至互联网浏览器程序或者软件客户端程序,以及通过电子邮件方式返回服务器端运算结果。自己动手编制程序。真正在研究工作第55页,讲稿共66张,创作于星期三中,会发现任何现成的软件都会
47、有这样或那样的不足。这时可以自己动手,或者与计算机工作人员进行合作,开发新的软件以弥补现有软件的不足。算法,顾名思义就是解决问题的计算方法,由于它比较抽象、枯燥,而且是隐含在软件之中,一般人并不关心,在此不做详细讨论。(二)蛋白质组信息学概述(二)蛋白质组信息学概述由于蛋白质组学是从蛋白质的整体水平进行研究,这就决定了蛋白质组研究产生的数据第56页,讲稿共66张,创作于星期三具有高信息量的特点,比如那“满天星”似的双向凝胶电泳图谱。为了有效而快速地对研究数据进行分析,生物信息学正在成为人们解决问题的希望所在。因此,蛋白质组学与生物信息学的相互交叉、融合就显得格外引人注目。本节介绍蛋白质组信息学
48、的兴起,其主要研究内容以及未来的发展趋势。1、蛋白质组信息学的兴起、蛋白质组信息学的兴起前已述及,人类基因的计划是生物信息学产生的主要动力之一。因此,通常谈及的生物第57页,讲稿共66张,创作于星期三信息学指的是其狭义概念,即基因组信息学。目前基因信息学的研究领域主要集中在以下几个方面:大规模基因组测序中的信息分析;新基因和新SNP的发现与鉴定;非编码区信息结构分析;遗传密码起源与生物进化的研究;完整基因组的比较研究;生物大分子的结构模拟与药物设计;生物信息学分析方法的研究等。随着人类基因组计划接近尾声,生命科学已步入了后基因组时代。蛋白质组研究正是后基因组计划中的一个重要第58页,讲稿共66
49、张,创作于星期三组成部分,由于蛋白质组研究高信息量的特点,其对生物信息学的渴望正在不断加大,故围绕蛋白质组研究而展开的生物信息学研究也正在逐渐兴起,包括对蛋白质组研究的实验数据进行获取、加工、存贮、检索与分析等。另外对蛋白质组研究的分析也导致了新的方法学问题,从数学角度来看并不是简单的NP问题、动力系统问题或不确定问题,而是基因表达的网络问题,故需要发展新的方法和工具。因此,围绕蛋白质组研究而开 第59页,讲稿共66张,创作于星期三展的蛋白质组信息学可视为生物信息学的一个新的分支。2、蛋白质组信息学的研究内容、蛋白质组信息学的研究内容目前蛋白质组研究采用的实验方法,主要有双向电泳、质谱、蛋白质
50、微量测序、酵母双杂交等。因为生物信息学是通过对生物学的实验数据进行获取、加工、存贮、检索与分析,进而达到揭示数据中所蕴含的生物学意义的目的,故生物信息学在蛋白质组研究中的应用将主要围绕双向电泳、蛋白质测序等 第60页,讲稿共66张,创作于星期三实验技术进行生物信息的获取、加工等。具体而言,大致有以下几个方面:对双向电泳结果进行图像分析,从中寻找出疾病与生理状态下表达有差异的蛋白质斑点、构建双向电泳图谱数据库;参与对双向电泳凝胶中的蛋白质斑点的鉴定,包括单独或综合运用质谱数据、氨基酸测序结果、氨基酸组成分析结果等数据查询数据库以鉴定蛋白质;辅助大规模的酵母双杂交技术分析蛋白质之间的相互作用,包括