《植物代谢组学.ppt》由会员分享,可在线阅读,更多相关《植物代谢组学.ppt(42页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、河南农业大学生命科学学院赵会杰目 录一、植物代谢组学的概念和意义一、植物代谢组学的概念和意义二、代谢组学在系统生物学中的地位二、代谢组学在系统生物学中的地位三、植物代谢组学的研究方法三、植物代谢组学的研究方法四、代谢组学在植物科学中的应用四、代谢组学在植物科学中的应用五、展望五、展望一、植物代谢组学的概念和意义一、植物代谢组学的概念和意义1、概念、概念生物学中生物学中“组组”的概念:的概念:“组组”:来源于希腊语:来源于希腊语ome,意指每个、所有、,意指每个、所有、全部。全部。以它为后缀最先用于基因组:以它为后缀最先用于基因组:genome,指一个物指一个物种的全部遗传组成。种的全部遗传组成
2、。自基因组学概念提出后,带组学(自基因组学概念提出后,带组学(omics)的概的概念出现有念出现有200多种。如蛋白组学、代谢组学等。多种。如蛋白组学、代谢组学等。近年来近年来,随着生命科学研究的发展随着生命科学研究的发展,尤其是完成尤其是完成拟南芥拟南芥(Arabidopsis thaliana)和水稻(和水稻(Oryza sativa)等植物的基因组测序后等植物的基因组测序后,植物科学发生了翻植物科学发生了翻天覆地的变化。有人说生命科学研究跨入了后基因天覆地的变化。有人说生命科学研究跨入了后基因组时代。组时代。人们已经把目光从基因的测序转移到了基因的人们已经把目光从基因的测序转移到了基因的
3、功能研究。在研究功能研究。在研究DNA的基因组学、的基因组学、mRNA的转的转录组学和蛋白质的蛋白组学后录组学和蛋白质的蛋白组学后,接踵而来的是研究接踵而来的是研究代谢物的代谢组学。代谢物的代谢组学。代谢组:代谢组:是指细胞或者生物体内的所有代谢物的总和,也有人将它定义为细胞、组织、器官或者生物体内的所有小分子代谢组分的集合。代谢组学:代谢组学:通过大量代谢成分的定性、定量分析来定义生物体的生化表型(代谢表型)及其与基因型的关系,从而为研究基因功能、诠释生命现象提供大量的代谢信息,这就是代谢组学(metabolomics)。2、意义、意义 通过研究不同物种的代谢产物通过研究不同物种的代谢产物
4、,可以指导植物分可以指导植物分类学类学 ,对植物进行更加合理的分类对植物进行更加合理的分类;通过研究不同基因型植物的代谢物通过研究不同基因型植物的代谢物 ,可以发现新可以发现新的功能基因的功能基因 ,促进转基因植物的研究促进转基因植物的研究 ,同时还可以对同时还可以对转基因植物及其在食用方面的安全性进行代谢物组学转基因植物及其在食用方面的安全性进行代谢物组学水平上的评估水平上的评估;通过研究不同生态环境下植物的代谢产物通过研究不同生态环境下植物的代谢产物 ,了解了解植物的区域性分布。如果所研究的植物是某种药用植植物的区域性分布。如果所研究的植物是某种药用植物物 ,则就可以应用于中药道地药材的确
5、定则就可以应用于中药道地药材的确定;植物在受到某种内部或外界因素刺激之后会产生植物在受到某种内部或外界因素刺激之后会产生的特定的应激变化的特定的应激变化 ,最终会表现在代谢物的改变上最终会表现在代谢物的改变上 ,通过研究这种变化规律通过研究这种变化规律 ,为从植物中定向培养得到某为从植物中定向培养得到某一特定代谢物提供指导。一特定代谢物提供指导。2020世纪末到本世纪初,大规模的基因组测序世纪末到本世纪初,大规模的基因组测序工作产生了海量数据。但仅仅是依赖工作产生了海量数据。但仅仅是依赖DNADNA序列我序列我们能够得到的信息还是有限的,科学家迫切希望们能够得到的信息还是有限的,科学家迫切希望
6、在整体水平上了解基因表达的特征和基因所编码在整体水平上了解基因表达的特征和基因所编码的产物的功能。因此,的产物的功能。因此,“功能基因组学功能基因组学(functional genomics)”(functional genomics)”的研究逐渐兴起。它的研究逐渐兴起。它是通过大规模地分析细胞内转录水平是通过大规模地分析细胞内转录水平(转录组转录组)和和蛋白质水平蛋白质水平(蛋白质组蛋白质组)上的变化,进而推测基因上的变化,进而推测基因功能,这就开启了功能,这就开启了“功能基因组学功能基因组学”的研究。的研究。二、代谢组学在系统生物学中的地位二、代谢组学在系统生物学中的地位 然而,转录组和蛋
7、白质组不一定能很好地预测基因的功能。然而,转录组和蛋白质组不一定能很好地预测基因的功能。尽管转录组携带了细胞内蛋白质合成的密码子,但是尽管转录组携带了细胞内蛋白质合成的密码子,但是mRNAmRNA水平水平上的增加与蛋白质水平的增加并不一致,况且蛋白质合成后的上的增加与蛋白质水平的增加并不一致,况且蛋白质合成后的各种修饰往往带来活性的改变。考虑到这些因素,仅凭转录组各种修饰往往带来活性的改变。考虑到这些因素,仅凭转录组或者蛋白质组的改变不一定能够准确预测生化表型或者蛋白质组的改变不一定能够准确预测生化表型(代谢物代谢物)的的改变。改变。另外,在建立转录谱和蛋白谱的时候,要鉴定一种另外,在建立转录
8、谱和蛋白谱的时候,要鉴定一种mRNAmRNA或或者蛋白质,现代的技术手段主要是通过序列相似性比对和与数者蛋白质,现代的技术手段主要是通过序列相似性比对和与数据库的匹配来确定的,这样的鉴定主要依赖于匹配度,因此不据库的匹配来确定的,这样的鉴定主要依赖于匹配度,因此不是直接的。由于现有数据库信息的缺乏,转录组和蛋白质组也是直接的。由于现有数据库信息的缺乏,转录组和蛋白质组也就只能提供有限的信息。就只能提供有限的信息。代谢组可以在代谢物的基础上来区分表型;不论是可见的代谢组可以在代谢物的基础上来区分表型;不论是可见的还是不可见的表型,用代谢物来区分可能是更无偏见的,至少还是不可见的表型,用代谢物来区
9、分可能是更无偏见的,至少是提供了代谢水平上的证据。而且,在那些由突变体或者转基是提供了代谢水平上的证据。而且,在那些由突变体或者转基因造成的可以测量的表型变化的实例中,代谢组的方法可以被因造成的可以测量的表型变化的实例中,代谢组的方法可以被用来阐明造成这种可见表型的生化原因或者结果。用来阐明造成这种可见表型的生化原因或者结果。因此,以因此,以DNADNA、mRNAmRNA、蛋白质和代谢物为研究对象的基因组、蛋白质和代谢物为研究对象的基因组学、转录组学、蛋白质组学和代谢组学是一个密切相关的整体,学、转录组学、蛋白质组学和代谢组学是一个密切相关的整体,他们共同构成系统生物学(他们共同构成系统生物学
10、(systems biology)systems biology)。基因组、转录组、蛋白质组和代谢组的关系基因组、转录组、蛋白质组和代谢组的关系系统生物学研究的四个层次系统生物学研究的四个层次代谢组学研究技术步骤代谢组学研究技术步骤三、植物代谢组学的研究方法三、植物代谢组学的研究方法植物材料培养植物材料培养数据分析与解释数据分析与解释样品制备样品制备成分分析与鉴定成分分析与鉴定1、植物培养(栽培)、植物培养(栽培)对研究对象进行培育的目的是为了对样本的对研究对象进行培育的目的是为了对样本的稳定性进行控制稳定性进行控制 ,相对于微生物和动物而言相对于微生物和动物而言 ,植植物的人工栽培需要考虑更
11、多的问题物的人工栽培需要考虑更多的问题,如中药材在如中药材在不同年龄、不同发育阶段、不同部位以及光照、不同年龄、不同发育阶段、不同部位以及光照、水肥、耕作等环境因素的微小差异都可引起生理水肥、耕作等环境因素的微小差异都可引起生理状态的变化状态的变化,而这些非可控及可控双重因素的影而这些非可控及可控双重因素的影响很难进行精确的控制响很难进行精确的控制,从而影响药用植物代谢从而影响药用植物代谢组研究的重复性。为了解决以上问题组研究的重复性。为了解决以上问题 ,推荐使用推荐使用大容量的培养箱大容量的培养箱 ,定时更换培养箱中栽培对象的定时更换培养箱中栽培对象的位置位置,以及使用无土栽培技术等以及使用
12、无土栽培技术等,利用无土栽培利用无土栽培系统将水和养分直接引入植物根部系统将水和养分直接引入植物根部,并且对供给并且对供给量进行精确地控制量进行精确地控制 ,大大提高了实验的重复性。大大提高了实验的重复性。植物代谢物样品制备分为组织取样匀浆抽提保存样品预处理等步骤。代谢产物通常用水或有机溶剂(如甲醇和己烷等)分别提取,获得水提取物和有机溶剂提取物,从而把非极性的亲脂相和极性相分开。分析之前,通常先用固相微萃取、固相萃取和亲和色谱等方法进行预处理。然而植物代谢物千差万别,其中很多物质稍受干扰结构就会发生改变,且对其分析鉴定所采用的设备也不同。目前还没有适合所有代谢物的抽提方法,通常只能根据所要分
13、析的代谢物特性及使用的鉴定手段选择合适的提取方法。而抽提时间、温度、溶剂成分和质量及实验者的技巧等诸多因素也将影响样品制备的水平。2、样品制备、样品制备 对获得的样品中所有代谢物进行分析鉴定是代谢组学研究对获得的样品中所有代谢物进行分析鉴定是代谢组学研究的关键步骤的关键步骤,也是最困难和多变的步骤。也是最困难和多变的步骤。与原有的各种组学技术只分析特定类型的物质不同与原有的各种组学技术只分析特定类型的物质不同,代谢代谢组学分析对象的大小、数量、官能团、挥发性、带电性、电迁组学分析对象的大小、数量、官能团、挥发性、带电性、电迁移率、极性以及其他物理化学参数差异很大移率、极性以及其他物理化学参数差
14、异很大,要对它们进行无要对它们进行无偏向的全面分析偏向的全面分析,单一的分离分析手段往往难以保证。色谱、单一的分离分析手段往往难以保证。色谱、质谱、核磁共振、红外光谱、库仑分析、紫外吸收、荧光散射、质谱、核磁共振、红外光谱、库仑分析、紫外吸收、荧光散射、发射性检测和光散射等分离分析手段及其组合都被应用于代谢发射性检测和光散射等分离分析手段及其组合都被应用于代谢组学的研究。一般根据样品的特性和实验目的组学的研究。一般根据样品的特性和实验目的,可选择最合适可选择最合适的分析方法。的分析方法。目前最常用的分离分析手段:目前最常用的分离分析手段:气相色谱和质谱联用气相色谱和质谱联用(GC/MS)(GC
15、/MS)液相色谱和质谱联用液相色谱和质谱联用(LC/MS)(LC/MS)毛细管电泳质谱联用技术毛细管电泳质谱联用技术(CE/MS)(CE/MS)核磁共振核磁共振(NMR)(NMR)傅里叶变换红外光谱与质谱联用傅里叶变换红外光谱与质谱联用(FTIR/MS)(FTIR/MS)。3 3、成分分析鉴定、成分分析鉴定 色谱是最常用和有效的分离分析工具色谱是最常用和有效的分离分析工具,其与质谱其与质谱的联用则可以完成从成分分离到鉴定的一整套工作。的联用则可以完成从成分分离到鉴定的一整套工作。GC/MSGC/MS和和LC/MSLC/MS可以同时检测出数百种化合物可以同时检测出数百种化合物,包括糖包括糖类、有
16、机酸、氨基酸、脂肪酸和大量不同的次生代类、有机酸、氨基酸、脂肪酸和大量不同的次生代谢物。谢物。GC/MSGC/MS有很好的分离效率且相对较为经济有很好的分离效率且相对较为经济,但需但需要对样品进行衍生化预处理要对样品进行衍生化预处理,这一步骤会耗费额外的这一步骤会耗费额外的时间时间,甚至引起样品的变化。受此限制甚至引起样品的变化。受此限制,GC/MS,GC/MS无法分无法分析膜脂等热不稳定性的物质和分子量较大的代谢产析膜脂等热不稳定性的物质和分子量较大的代谢产物。物。For example:Roessner等等(2000,2001)利用利用GC/MS对马对马铃薯进行高通量代谢物分析铃薯进行高通
17、量代谢物分析,同时检测到同时检测到150种化合物种化合物,其中其中77种被鉴定为氨基酸、有机种被鉴定为氨基酸、有机酸或糖。酸或糖。利用利用GC/MS进行代谢组学研究的代表性进行代谢组学研究的代表性工作是工作是Fiehn等等(2000)的一系列有关植物代的一系列有关植物代谢的研究。他们用谢的研究。他们用GC/MS对模式植物拟南芥对模式植物拟南芥的叶子提取物进行了研究的叶子提取物进行了研究,定量分析了定量分析了326个个化合物化合物,并确定了其中部分化合物的结构。并确定了其中部分化合物的结构。LC/MSLC/MS中目前应用较广的是高效液相色谱和中目前应用较广的是高效液相色谱和质谱联用质谱联用(HP
18、LC/MS)(HPLC/MS)。HPLCHPLC与与GCGC原理相似原理相似,但在进但在进样前不需进行衍生化处理样前不需进行衍生化处理,适合那些不稳定、不适合那些不稳定、不易衍生化、不易挥发和分子量较大的化合物。易衍生化、不易挥发和分子量较大的化合物。HPLC/MSHPLC/MS选择性和灵敏度都较好选择性和灵敏度都较好,但分析的时间相但分析的时间相对较长对较长,且需依赖纯的参照物。且需依赖纯的参照物。Fiehn(2003)Fiehn(2003)利用利用HPLC/MSHPLC/MS检测笋瓜检测笋瓜(CucurbitamaximaCucurbitamaxima GelberGelber Zentn
19、erZentner)叶柄和叶片叶柄和叶片抽提物抽提物,检测到了超过检测到了超过400400种代谢物种代谢物,有有9090种被定种被定性性,其中大部分是氨基酸、糖和糖苷。其中大部分是氨基酸、糖和糖苷。HuhmanHuhman和和Sumner(2002)Sumner(2002)在紫花苜蓿和蒺藜状在紫花苜蓿和蒺藜状苜蓿中各鉴定出苜蓿中各鉴定出1515个和个和2727个皂角甙个皂角甙,并在紫花苜并在紫花苜蓿中找到了蓿中找到了2 2个新的乙二酸皂角甙。个新的乙二酸皂角甙。CE/MSCE/MS分离样品效率比普通的色谱质谱分离样品效率比普通的色谱质谱联用要高得多联用要高得多,更为便利的是其耗时很短更为便利的
20、是其耗时很短,往往在往往在1010分钟内就能完成一个样品的分析分钟内就能完成一个样品的分析过程。过程。TolstikovTolstikov等等(2003)(2003)用用CE/MSCE/MS对拟南芥对拟南芥进行代谢组分析进行代谢组分析,分离效果远远超过了分离效果远远超过了FiehnFiehn等用等用GC/MSGC/MS进行的先期工作进行的先期工作,检测到超检测到超过过700700个不同的色谱峰值个不同的色谱峰值,其中包括许多以其中包括许多以前未检测到的脂类化合物及次生代谢物。前未检测到的脂类化合物及次生代谢物。在代谢组学领域在代谢组学领域,核磁共振最初被用于病理生理学和核磁共振最初被用于病理生
21、理学和药理毒理学方面,但目前也已被广泛用于植物代谢组学药理毒理学方面,但目前也已被广泛用于植物代谢组学研究。其优点是:研究。其优点是:A.A.不同于质谱具有离子化程度和基质干扰等问题不同于质谱具有离子化程度和基质干扰等问题,NMR,NMR没有偏向性没有偏向性,对所有化合物的灵敏度是一样的。对所有化合物的灵敏度是一样的。B.B.NMRNMR无损伤性无损伤性,不破坏样品的结构和性质不破坏样品的结构和性质,可在接近可在接近生理条件下进行实验生理条件下进行实验,可在一定的温度和缓冲液范围内选可在一定的温度和缓冲液范围内选择实验条件择实验条件,可以进行实时和动态的检测。可以进行实时和动态的检测。C.C.
22、NMRNMR氢谱的谱峰与样品中各化合物的氢原子是一一氢谱的谱峰与样品中各化合物的氢原子是一一对应的对应的,所测样品中的每一个氢原子在图谱中都有其相关所测样品中的每一个氢原子在图谱中都有其相关的谱峰的谱峰,图谱中信号的相对强弱反映样品中各组分的相对图谱中信号的相对强弱反映样品中各组分的相对含量含量,更为直观。更为直观。因此因此,NMR,NMR方法很适合研究代谢产物中的复杂成分。方法很适合研究代谢产物中的复杂成分。Examples:Examples:Ward Ward等等(2003)(2003)用用1 1H-NMRH-NMR对多种不同生态型的拟南芥对多种不同生态型的拟南芥进行了代谢组分析进行了代谢
23、组分析,在碳水化合物和脂肪族物质中都发在碳水化合物和脂肪族物质中都发现了差异现了差异,说明了植物代谢物和生态型差异的相关性。说明了植物代谢物和生态型差异的相关性。Hyung-KyoonHyung-Kyoon等等(2004)(2004)用用1 1H-NMRH-NMR对野生型和过表达水对野生型和过表达水杨酸合成基因的转基因烟草杨酸合成基因的转基因烟草(NicotianaNicotiana tabacumtabacum)的叶的叶片和叶脉进行了研究片和叶脉进行了研究,通过进行通过进行TMVTMV嫁接和对照实验嫁接和对照实验,得得到多个峰值变化到多个峰值变化,大部分峰被鉴定为氯原酸、苹果酸和大部分峰被鉴
24、定为氯原酸、苹果酸和糖。此实验提供了一种有效的不需过多步预处理程序的糖。此实验提供了一种有效的不需过多步预处理程序的区分野生型和转基因植物的方法。区分野生型和转基因植物的方法。NMRNMR也有其缺点也有其缺点:与与GC/MSGC/MS和和LC/MSLC/MS相比相比,NMR,NMR的缺点是灵敏度低的缺点是灵敏度低,有有可能形成信号重叠可能形成信号重叠,且其对样品制备的要求很高。且其对样品制备的要求很高。因为动态范围有限因为动态范围有限,很难同时测定生物体系中共很难同时测定生物体系中共存的浓度相差较大的代谢产物。存的浓度相差较大的代谢产物。FTIRFTIR主要测定样品中各成分的功能基团和高极性主
25、要测定样品中各成分的功能基团和高极性键的振动键的振动,而特定的化学结构有特定的吸收频率而特定的化学结构有特定的吸收频率,通过通过测定实验样品的红外吸收频率和强度测定实验样品的红外吸收频率和强度,可以辨别出各个可以辨别出各个成分。成分。FTIRFTIR优点:优点:扫描速度快、光通量大、高分辨率、高信噪比及扫描速度快、光通量大、高分辨率、高信噪比及测定光谱范围宽。测定光谱范围宽。FTIRFTIR缺点:缺点:不可区分异构物不可区分异构物,且组分片段和一些络合离子也对且组分片段和一些络合离子也对其有影响其有影响,由于离子抑制不能进行定量分析。由于离子抑制不能进行定量分析。ExamplesExample
26、s:AharoniAharoni等等(2002)(2002)利用高分辨率的利用高分辨率的FTIR/MSFTIR/MS联联用仪器对凤梨草莓用仪器对凤梨草莓(FragariaFragaria ananassaananassa)组织进组织进行了分析行了分析,依据不同的质荷比找到了依据不同的质荷比找到了5 8445 844个不同个不同质量的物质质量的物质,并根据对化合物中高含量的元素的并根据对化合物中高含量的元素的精确质量测定估计了其中一半以上物质的化学结精确质量测定估计了其中一半以上物质的化学结构式。构式。结果表明结果表明,在草莓的不同组织中都含有多种在草莓的不同组织中都含有多种类的初生代谢物类的初
27、生代谢物(如氨基酸、脂肪酸和碳水化合如氨基酸、脂肪酸和碳水化合物物)及次生代谢物及次生代谢物(如类黄酮和萜类化合物如类黄酮和萜类化合物)。4 4、数据分析与解释、数据分析与解释 样品成分分析鉴定之后样品成分分析鉴定之后,需要对所获得的数据需要对所获得的数据进行相应的整合处理进行相应的整合处理,这也是代谢组学研究中十分这也是代谢组学研究中十分关键的步骤。应用高通量的检测分析工具可以得关键的步骤。应用高通量的检测分析工具可以得到海量的数据到海量的数据,如果不对其进行合理的处理如果不对其进行合理的处理,这些这些纷扰的数据反而对研究工作是有害无利的。可应纷扰的数据反而对研究工作是有害无利的。可应用模式
28、识别和多维统计分析等方法从这些大量的用模式识别和多维统计分析等方法从这些大量的数据中获得有用的信息数据中获得有用的信息,这些方法能够为数据降维这些方法能够为数据降维,使它们更易于可视化和分类。使它们更易于可视化和分类。目前数据分析常用的方法有两类:目前数据分析常用的方法有两类:非监督方法非监督方法(unsupervised(unsupervised method)method)有监督方法有监督方法(supervised method)(supervised method)非监督方法是用来探索完全未知的数据特征非监督方法是用来探索完全未知的数据特征的方法的方法,对原始数据信息依据样本特性进行归类
29、对原始数据信息依据样本特性进行归类,把具有相似特征的目标数据归在同源的类里把具有相似特征的目标数据归在同源的类里,并并采用相应的可视化技术直观地表达出来。采用相应的可视化技术直观地表达出来。应用在此领域的常见方法有应用在此领域的常见方法有:聚类分析聚类分析(cluster analysis)(cluster analysis)主成分分析主成分分析(principal components(principal components analysis,PCAanalysis,PCA)聚类分析:依据依据物以类聚物以类聚的原理分析具有相似性的事物的原理分析具有相似性的事物,将分类对象置将分类对象置于一
30、个多维空间中于一个多维空间中,根据事物彼此不同的属性进行辨认根据事物彼此不同的属性进行辨认,将性将性质相近的归入一类质相近的归入一类,这样归在同一类的事物具有高度的相似性这样归在同一类的事物具有高度的相似性;聚类分析就是把事物按其相似程度进行分类聚类分析就是把事物按其相似程度进行分类,并找出每一类并找出每一类事物共同特征的分析工具。事物共同特征的分析工具。具体到代谢组学中具体到代谢组学中,被归入一类的物质有相同的特征被归入一类的物质有相同的特征,可可能有相同的功能作用能有相同的功能作用,这样通过同一类事物中一个研究较为清这样通过同一类事物中一个研究较为清晰的物质可以推断该类中其他物质的功能作用
31、。晰的物质可以推断该类中其他物质的功能作用。聚类分析过程通常可分为以下步骤聚类分析过程通常可分为以下步骤:数据收集并且收集相应的变量数据收集并且收集相应的变量产生一个相似矩阵产生一个相似矩阵决决定把目标总体细分为几类定把目标总体细分为几类对每一种类别相应的定义对每一种类别相应的定义实施实施聚类分析聚类分析产生结果。产生结果。主成分分析(PCA):PCAPCA是目前应用最为广泛的多维分析方法之一。其特是目前应用最为广泛的多维分析方法之一。其特点是将分散在一组变量上的信息集中到某几个综合指点是将分散在一组变量上的信息集中到某几个综合指标标,即主成分即主成分(principal(principal
32、component,PCcomponent,PC)上上,利用这些利用这些主成分来描述数据集内部结构主成分来描述数据集内部结构,实际上也起着数据降维实际上也起着数据降维的作用。的作用。主成分是由原始变量按一定的权重经线性组合而主成分是由原始变量按一定的权重经线性组合而成的新变量。这些变量具有以下性质成的新变量。这些变量具有以下性质:每一个每一个PCPC之间都是正交的之间都是正交的;第第1 1个个PCPC包含了数据集的绝大部分方差包含了数据集的绝大部分方差,第第2 2个次个次之之,依此类推。依此类推。这样这样,由头由头2 2个或个或3 3个个PCPC作图作图,就能够很好地代表数就能够很好地代表数据
33、集所包含的生物化学变化。据集所包含的生物化学变化。如果存在一些有关数据的先验消息和假设如果存在一些有关数据的先验消息和假设,有监督有监督方法比非监督方法更适合且更有效。方法比非监督方法更适合且更有效。有监督方法在已有知识的基础上建立信息组有监督方法在已有知识的基础上建立信息组(class(class information),information),并利用所建立的组对未知数据进行辨识、并利用所建立的组对未知数据进行辨识、归类和预测。归类和预测。在这类方法中在这类方法中,由于建立模型时有可供学习利用的由于建立模型时有可供学习利用的训练样本训练样本,所以称为有监督学习。所以称为有监督学习。应用于
34、该领域的常见方法有:应用于该领域的常见方法有:线性判别分析线性判别分析(linear discrimination analysis)(linear discrimination analysis)偏最小二乘法偏最小二乘法-显著性分析显著性分析(PLS-discrimination PLS-discrimination analysis)analysis)人工神经元网络人工神经元网络(artificial neural(artificial neural networksANNnetworksANN)在信息时代在信息时代,利用网络资源进行研究是必不可少的。利用网络资源进行研究是必不可少的。而对
35、千头万绪的植物代谢物研究而对千头万绪的植物代谢物研究,建立相应的网上数据库建立相应的网上数据库也是势在必行的。这些数据库的建立也有利于联结代谢也是势在必行的。这些数据库的建立也有利于联结代谢组学与其他系统生物学分支的关系组学与其他系统生物学分支的关系.目前目前,最为成熟的数据库是关于模式植物拟南芥的最为成熟的数据库是关于模式植物拟南芥的:The Arabidopsis Information Resource(TAIR)http:/www.arabidopsis.org。其他常用的网上植物资源有其他常用的网上植物资源有:http:/www.york.ac.uk/res/garnet/garne
36、t.htm http:/www.maizegdb.org http:/www.genome.ad.jp/kegg/pathway.html 此外网上已有一些与代谢和代谢组学有关的数据库此外网上已有一些与代谢和代谢组学有关的数据库,主要介主要介绍以下几个绍以下几个:http:/www.armet.org 是一个涵盖大部分植物代谢组学研究工作的网站是一个涵盖大部分植物代谢组学研究工作的网站,包含了这包含了这些工作开展的时间些工作开展的时间,甚至还有详细的实验步骤甚至还有详细的实验步骤,并将代谢物信息标并将代谢物信息标准化准化,以便于研究者交流。以便于研究者交流。http:/medicago.vbi
37、.vt.edu/dome.html 有许多关于代谢物的原始数据和分析结果有许多关于代谢物的原始数据和分析结果,同时也有对人们同时也有对人们感兴趣的一些植物物种的分子生物学研究感兴趣的一些植物物种的分子生物学研究,分析结果用多维统计分析结果用多维统计软件处理后可用于软件处理后可用于OMEs的浏览器浏览。的浏览器浏览。http:/metacyc.org 是一个关于代谢物的数据库是一个关于代谢物的数据库,阐述了阐述了超过超过150种生物体中的代谢途径种生物体中的代谢途径,包含了从大量的文献和网上资源包含了从大量的文献和网上资源中得到的代谢途径、反应、酶和底物的资料。中得到的代谢途径、反应、酶和底物的
38、资料。http:/www.chem.qmul.ac.uk/iubmb/enzyme 对主要代谢途径及涉及的关键酶进行了详尽的描述。对主要代谢途径及涉及的关键酶进行了详尽的描述。虽然植物代谢组学虽然植物代谢组学目前尚处于萌芽阶段目前尚处于萌芽阶段,但其应用前景是十分广但其应用前景是十分广阔的。下面介绍其中的阔的。下面介绍其中的部分应用。部分应用。1 1、代谢组分析、代谢组分析 应用代谢组学技术可同时对大量代谢应用代谢组学技术可同时对大量代谢物进行定性定量分析物进行定性定量分析,常用来观察植物在常用来观察植物在环境条件改变下的代谢物变化环境条件改变下的代谢物变化;也可用于也可用于研究同一植物不同部
39、位或不同时期的代谢研究同一植物不同部位或不同时期的代谢物种类与含量变化物种类与含量变化;也可根据相关联的代也可根据相关联的代谢物的量的变化谢物的量的变化,推测相应的代谢途径和推测相应的代谢途径和代谢网络。代谢网络。Example:Fiehn(2003)利用利用GC/MS对笋瓜对笋瓜(Cucurbita maxima GelberZentner)的叶柄脉管抽提物和叶片的叶柄脉管抽提物和叶片抽提物进行了代谢物分析抽提物进行了代谢物分析,得到了得到了400多个峰多个峰,通过通过与质谱数据库比对与质谱数据库比对,对其中一小部分进行了定性对其中一小部分进行了定性,初初步判断为何种物质步判断为何种物质;比
40、较了叶柄与叶片间代谢物组比较了叶柄与叶片间代谢物组分的不同。分的不同。值得注意的是值得注意的是,即使个体中每种代谢物的量变即使个体中每种代谢物的量变化很大化很大,其各组分间的比值也能一直维持稳定其各组分间的比值也能一直维持稳定,这说这说明了植物中的代谢物虽然种类繁多明了植物中的代谢物虽然种类繁多,但都是互相关但都是互相关联的。联的。植物利用复杂的机制来维持体内主要代谢物相植物利用复杂的机制来维持体内主要代谢物相对稳定的水平。对代谢组的分析力求可检测样品中对稳定的水平。对代谢组的分析力求可检测样品中每种代谢物每种代谢物,并可监测各种条件变化下代谢物的变并可监测各种条件变化下代谢物的变化化,这是进
41、行功能基因组学研究的基础。这是进行功能基因组学研究的基础。2 2、代谢途径的描述、代谢途径的描述 在对某一代谢途径中所有代谢在对某一代谢途径中所有代谢物进行了系统研究后物进行了系统研究后,下一步工作就下一步工作就是对代谢途径的描述。在找到该途是对代谢途径的描述。在找到该途径一系列底物、产物、中间体和关径一系列底物、产物、中间体和关键酶的基础上键酶的基础上,阐明这条代谢途径的阐明这条代谢途径的调节机制和关键调节位点。调节机制和关键调节位点。用代谢组学手段可以方便地找用代谢组学手段可以方便地找到调节位点到调节位点因为在该处因为在该处,底物和底物和关键酶的浓度将会发生相反的变化。关键酶的浓度将会发生
42、相反的变化。For example:TiessenTiessen等等(2002)(2002)用用HPLCHPLC对马铃薯块茎进行了代对马铃薯块茎进行了代谢组分析谢组分析,检测了淀粉合成途径中的一系列底物、中检测了淀粉合成途径中的一系列底物、中间物、酶及产物量的变化间物、酶及产物量的变化,再通过对野生株和含有异再通过对野生株和含有异源腺苷二磷酸葡萄糖焦磷酸化酶源腺苷二磷酸葡萄糖焦磷酸化酶(AGPaseAGPase)转基因株转基因株马铃薯进行对比研究马铃薯进行对比研究,提出了淀粉合成途径中一种新提出了淀粉合成途径中一种新的调节机制的调节机制在离开母体情况下在离开母体情况下,马铃薯块茎中淀马铃薯块茎
43、中淀粉合成关键酶粉合成关键酶AGPaseAGPase的催化亚基的催化亚基AGPBAGPB会发生可逆的会发生可逆的氧化还原反应形成二聚体氧化还原反应形成二聚体,使使AGPaseAGPase失活失活,从而抑制从而抑制淀粉生成。淀粉生成。目前目前,代谢组学应用于此方面的研究报道尚不多见代谢组学应用于此方面的研究报道尚不多见,主要原因是确定代谢途径比测定代谢物更为困难主要原因是确定代谢途径比测定代谢物更为困难,往往往只能进行间接的定性估计往只能进行间接的定性估计,从一个个点的代谢物到从一个个点的代谢物到一条完整的代谢途径还有很长的路要走。一条完整的代谢途径还有很长的路要走。3 3、基因功能研究、基因功
44、能研究 代谢产物是基因表达的终产物代谢产物是基因表达的终产物,基因表基因表达上极微小的变化也可导致代谢物的大幅达上极微小的变化也可导致代谢物的大幅改变。以前往往通过可见的表型改变来判改变。以前往往通过可见的表型改变来判断基因表达水平的升降断基因表达水平的升降,耗时较长耗时较长,且有时且有时候基因表达变化无法引起表型改变候基因表达变化无法引起表型改变,而此时而此时植物体中某些代谢产物的含量却会发生变植物体中某些代谢产物的含量却会发生变化。这时化。这时,利用代谢组学方法检测代谢物的利用代谢组学方法检测代谢物的变化就可以判断基因表达水平的变化变化就可以判断基因表达水平的变化,从而从而推断基因的功能及
45、其对代谢流的影响。推断基因的功能及其对代谢流的影响。LytovchenkoLytovchenko等等(2002)(2002)通过对马铃薯通过对马铃薯叶片大量代谢物叶片大量代谢物,特别是光合作用途径中特别是光合作用途径中的中间体和终产物进行分析的中间体和终产物进行分析,研究了质体研究了质体葡萄糖磷酸变位酶葡萄糖磷酸变位酶(plastidialplastidial phosphoglucomutasephosphoglucomutase)基因在光合作用中基因在光合作用中对碳流的影响对碳流的影响,发现在其表达水平低的情发现在其表达水平低的情况下况下,虽然植物表型没有变化虽然植物表型没有变化,但是植物
46、组但是植物组织中的淀粉、糖和有机酸的含量都有一定织中的淀粉、糖和有机酸的含量都有一定降低。这说明质体葡萄糖磷酸变位酶基因降低。这说明质体葡萄糖磷酸变位酶基因表达水平的变化对植物的几条主要代谢途表达水平的变化对植物的几条主要代谢途径都有很大的影响。径都有很大的影响。4 4、与转录组学和蛋白质组学技术整合、与转录组学和蛋白质组学技术整合 转录组学、蛋白质组学和代谢组学是一转录组学、蛋白质组学和代谢组学是一个有机的整体个有机的整体,它们都是系统生物学它们都是系统生物学(system(system biology)biology)的重要组成部分。的重要组成部分。生物信息是按生物信息是按DNAmRNAD
47、NAmRNA蛋白质蛋白质代谢代谢产物方向流动的产物方向流动的,将所获得的这几者的信息联将所获得的这几者的信息联系起来系起来,有利于从整体研究生物系统对基因或有利于从整体研究生物系统对基因或环境变化的响应环境变化的响应,如可判断代谢物的变化是从如可判断代谢物的变化是从哪一个层面开始发生的。哪一个层面开始发生的。Examples:Examples:Ferrario-MeryFerrario-Mery等等(2002)(2002)整合了关于转录、酶活性及代整合了关于转录、酶活性及代谢物的数据研究谢物的数据研究烟草烟草中的碳氮代谢相互作用。通过对中的碳氮代谢相互作用。通过对NHNH4 4代代谢过程中主要
48、代谢物的定量分析谢过程中主要代谢物的定量分析,以及先前掌握的关于氮在以及先前掌握的关于氮在转录层面的知识转录层面的知识,分析了谷氨酰胺合成酶分析了谷氨酰胺合成酶(glutamine(glutamine synthetasesynthetase)在氮代谢过程中的作用在氮代谢过程中的作用,得到结论是代谢物量的得到结论是代谢物量的变化与转录水平无关变化与转录水平无关,而与转录后修饰调节有关。而与转录后修饰调节有关。YamazakiaYamazakia等等(2003)(2003)利用利用H P L C/P D A/E S I-M SH P L C/P D A/E S I-M S对对红色和绿色红色和绿色
49、紫苏紫苏的叶片和茎秆进行了代谢组分析的叶片和茎秆进行了代谢组分析,检测到了检测到了大约大约5050个峰。对其中与花青素有关的物质进行了定性定量鉴个峰。对其中与花青素有关的物质进行了定性定量鉴定和对比定和对比,然后用然后用mRNAmRNA差异显示技术对从两种紫苏的叶片中差异显示技术对从两种紫苏的叶片中提取到的提取到的mRNAmRNA进行了筛选进行了筛选,找到了一些差异基因。通过对这找到了一些差异基因。通过对这两种方法所获得的数据进行分析两种方法所获得的数据进行分析,推断了一些影响紫苏成色推断了一些影响紫苏成色的基因。的基因。第第1 1届届植物代谢组学大会于植物代谢组学大会于20022002年年4
50、 4月在月在荷兰荷兰举举行行,期间成立了国际植物代谢组学委员会期间成立了国际植物代谢组学委员会(ICPM)(ICPM),并,并建立了该委员会的国际官方网站建立了该委员会的国际官方网站(http:/(http:/www.metabolomics.nlwww.metabolomics.nl),),大大促进了全世界大大促进了全世界此领域研究者的交流。此领域研究者的交流。第第2 2届届植物代谢组学大会于植物代谢组学大会于20032003年在年在德国柏林德国柏林的的戈尔姆举行。戈尔姆举行。第第3 3届届植物代谢组学大会于植物代谢组学大会于20042004年年6 6月在月在美国的美国的爱荷华州爱荷华州举行