5-蛋白质三级结构预测.ppt

上传人:仙*** 文档编号:64380090 上传时间:2022-11-29 格式:PPT 页数:39 大小:1.39MB
返回 下载 相关 举报
5-蛋白质三级结构预测.ppt_第1页
第1页 / 共39页
5-蛋白质三级结构预测.ppt_第2页
第2页 / 共39页
点击查看更多>>
资源描述

《5-蛋白质三级结构预测.ppt》由会员分享,可在线阅读,更多相关《5-蛋白质三级结构预测.ppt(39页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、蛋白质结构预测蛋白质结构预测肖肖 飞飞蛋白质三级结构预测的方法123方法比较方法比较同源建模(比较建模)同源建模(比较建模)基础基础 -相似的序列结构相近 -PDB结构数据库的快速增长 -结构基因组学的启动 -发散进化特点特点 -相对精确可靠假设待预测三维结构的目标蛋白质为假设待预测三维结构的目标蛋白质为U(Unknown),利用同源模型化方法建立),利用同源模型化方法建立结构模型的过程包括下述结构模型的过程包括下述6个步骤:个步骤:(1)搜索结构模型的模板)搜索结构模型的模板(T)(2)序列比对)序列比对 (3)建立骨架)建立骨架 (4)构建目标蛋白质的侧链)构建目标蛋白质的侧链 (5)构建

2、目标蛋白质的环区)构建目标蛋白质的环区 (6)优化模型)优化模型U T预测结果准确率:预测结果准确率:对对于于具具有有60%等等同同的的序序列列,用用上上述述方方法法所所建建立立的的三三维维模模型型非非常常准准确确。若若序序列列的的等等同同部部分分超超过过60%,则则预预测测结结果果将将接接近近于于实实验验得得到到的的测试结果。测试结果。一一般般如如果果序序列列的的等等同同部部分分大大于于30%,则则可可以以期望得到比较好的预测结果。期望得到比较好的预测结果。同源建模数据库搜索数据库搜索选择模板选择模板依据模板构建骨架模型依据模板构建骨架模型环状、侧链的构建,优化环状、侧链的构建,优化结构合理

3、性评估结构合理性评估结构模型结构模型YESNO分子式:分子式:pGlu-His-Trp-Ser-Tyr-Gly-Leu-Arg-Pro-Gly-NH同源模建确定一对柔性分子相应功能团可能的空间取向模 板加模板3.3.同源建模法的局限性同源建模法的局限性 传传统统的的比比较较建建模模是是通通过过PSI-BLASTPSI-BLAST找找到到已已知知结结构构的的相相关关蛋蛋白白。最最近近如如进进行行profileprofileprofileprofile比比较较和和有有效效利利用用结结构构信信息息的的更更加加复复杂杂的的方方法法已已不不仅仅显显著著增增加加了了比比对对的的质质量量而而且且远远程程同同

4、源源(remote(remote homologue)homologue)检检测测的的能能力力。因因此此,比比较较建建模模和和折折叠叠识识别别在在基基于于模模板板的的建建模模方方法法中中的的区区别别现现已已十十分分模模糊糊。开开发发新新的的比比较较建建模模和和折折叠叠识识别别的的算算法法导导致致网网上上各各种种预预测测方法的出现,这包括结构预测方法的出现,这包括结构预测meta-meta-服务器。服务器。蛋白质三维结构预测服务通过因特网对公众蛋白质三维结构预测服务通过因特网对公众免费开放免费开放(同源建模同源建模):瑞士生物信息研究所瑞士生物信息研究所 SWISS-MODELSWISS-MOD

5、EL丹麦技术大学生物序列分析中心丹麦技术大学生物序列分析中心 CPHmodelsCPHmodels比利时拿摩大学比利时拿摩大学 ESyPred3DESyPred3D英国癌症研究中心英国癌症研究中心 3DJigsaw3DJigsaw4.4.常用建模服务器和软件简介常用建模服务器和软件简介Accelrys Discovery Studio 软件软件InsightIIFAMS同源蛋白质结构预测的方法同源蛋白质结构预测的方法1)片段组装法:)片段组装法:SWISS-MODEL2)距离几何法:)距离几何法:MODELLERSWISS-MODEL:http:/swissmodel.expasy.org/S

6、WISS-MODEL.htmlSWISS-MODEL:http:/swissmodel.expasy.org/SWISS-MODEL.html提交查询序列14模板序列与查询模板序列与查询序列的装载序列的装载结构的精细比对结构的精细比对分子骨架的形成分子骨架的形成侧链形成和优化侧链形成和优化加入氢原子、加入氢原子、优化回环优化回环能量最小化、能量最小化、结构封装结构封装SWISS-MODEL的工作过程:的工作过程:15最后的预测结果最后的预测结果 蛋白质具有很少的折叠类型(1000)基本步骤 将目标蛋白质序列与已知的折叠进行比对 将目标序列“安装”到选择的模板结构上 对模型进行优化、调整 检验模

7、型的合理性 关键方法 序列-结构比对 穿针引线法 穿针引线方法(折叠识别方法)穿针引线方法(折叠识别方法)有有很很多多蛋蛋白白质质具具有有相相似似的的空空间间结结构构,但但它它们们的序列等同部分小于的序列等同部分小于25%,即远程同源。,即远程同源。对对于于这这类类蛋蛋白白质质,很很难难通通过过序序列列比比对对找找出出它它们之间的关系,必须设计新的分析方法。们之间的关系,必须设计新的分析方法。对于一个未知结构的蛋白质(对于一个未知结构的蛋白质(U),),如果找到一个已知结构的远程同源蛋白质如果找到一个已知结构的远程同源蛋白质(T),),那么可以根据那么可以根据T的结构模板通过远程同源模型的结构

8、模板通过远程同源模型化方法建立化方法建立U的三维结构模型。的三维结构模型。U T(远程同源)一个远程同源模型化方法要解决三个问题:一个远程同源模型化方法要解决三个问题:(1)检测远程同源蛋白质()检测远程同源蛋白质(T););(2)U和和T的序列必须被正确地对比排列;的序列必须被正确地对比排列;(3)修改一般的同源模型化过程,以应用于相似度)修改一般的同源模型化过程,以应用于相似度非常低的情况,即处理更多的环区,建立合理的三非常低的情况,即处理更多的环区,建立合理的三维结构模型。维结构模型。如何解决第一个和第二个问题?如何解决第一个和第二个问题?基本思想是建立一个从基本思想是建立一个从U到已知

9、结构到已知结构T的线索,并通的线索,并通过一些基于环境或基于知识的势,评价序列与结构过一些基于环境或基于知识的势,评价序列与结构的适应性。的适应性。至于最后建立三维结构模型则是非常困难的至于最后建立三维结构模型则是非常困难的序列结构比对线索化的主要思想:线索化的主要思想:利用氨基酸的结构倾向(如形成二级结构利用氨基酸的结构倾向(如形成二级结构的倾向、疏水性、极性等),评价一个序的倾向、疏水性、极性等),评价一个序列所对应的结构是否能够适配到一个给定列所对应的结构是否能够适配到一个给定的结构环境中。的结构环境中。建立序列到结构的线索的过程称为线索化,建立序列到结构的线索的过程称为线索化,线索技术

10、又称折叠识别技术。线索技术又称折叠识别技术。线索化或者折叠识别的目标是为目标蛋白质线索化或者折叠识别的目标是为目标蛋白质U寻找合适的蛋白质模板,这些模板蛋白质与寻找合适的蛋白质模板,这些模板蛋白质与U没有显著的序列相似性,但却是远程同源的。没有显著的序列相似性,但却是远程同源的。线索化方法一般有线索化方法一般有5个基本组成部分:个基本组成部分:(1)已知三维折叠结构的数据库;)已知三维折叠结构的数据库;(2)一种适合于进行序列)一种适合于进行序列-结构比对的三维折结构比对的三维折叠信息的表示方法;叠信息的表示方法;(3)一个序列)一个序列-结构匹配函数,该函数对匹配结构匹配函数,该函数对匹配程

11、度进行打分;程度进行打分;(4)建立最优线索的策略,或者是进行序列)建立最优线索的策略,或者是进行序列-结构比对的策略;结构比对的策略;(5)一种评价序列)一种评价序列-结构比对显著性的方法。结构比对显著性的方法。假设存在有限数目的核心折叠(假设存在有限数目的核心折叠(core folds)核核心心折折叠叠实实际际上上是是构构成成蛋蛋白白质质空空间间形形状状的的基基本模式。本模式。建立核心折叠数据库建立核心折叠数据库预测预测-建立线索建立线索U序列与数据库核心折叠比对取最佳核心折叠U结构模型 一种基于序列与结构比对的最优线索化算法一种基于序列与结构比对的最优线索化算法令令:s s1 1,s,s

12、2 2,s sn n为蛋白质序列为蛋白质序列S S的的n n个元素个元素 C C1 1,C,C2 2,C,Cm m为数据库中核心折叠为数据库中核心折叠C C的的m m个核心区域个核心区域C Cijij为第为第i i个核心区域第个核心区域第j j个氨基酸位置个氨基酸位置 每一个核心区域由若干个氨基酸残基构成每一个核心区域由若干个氨基酸残基构成 设设t是一个从序列到核心折叠的线索,那么是一个从序列到核心折叠的线索,那么t说明了序列说明了序列S的哪些元素的哪些元素si,sj,sk,代表核心代表核心区域区域C1,C2,C3,的起始位置。的起始位置。这实际上是一种从序列这实际上是一种从序列S到核心折叠到

13、核心折叠C的比对的比对令令 代表核心折叠代表核心折叠C中的环到序列中的环到序列S中空位的中空位的映射,显然映射,显然 是通过线索化而确定的。是通过线索化而确定的。令令f(t)是进行比对的得分函数,其定义如下:是进行比对的得分函数,其定义如下:f(t)=g1(v,t)+g2(u,v,t)+g3(,t)g1(v,t)评价氨基酸残基评价氨基酸残基v所处的位置所处的位置g2(u,v,t)评价残基评价残基u和和v的相对位置,如果的相对位置,如果u和和v 键合,则得键合,则得分高;分高;g3(,t)评价环区,根据环区的大小进行打分。评价环区,根据环区的大小进行打分。线索化问题:线索化问题:对于给定的序列对

14、于给定的序列S和核心折叠和核心折叠C,选择一个线索,选择一个线索t,使得,使得f(t)的的值最小,即寻找一个从值最小,即寻找一个从S到到C的最佳映射。的最佳映射。动态规划 人工神经网络 分支定界法 线性规划 Monte Carlo方法 穿针引线法穿针引线法 理论基础 蛋白质的天然构象是热力学最稳定构象、也是 能量最低构象 能量函数 通过原子间作用力计算出的热力学能量 精确,但难以计算 伪能量函数 根据已知的三维结构知识得到的势能函数 常见的结构 低能量 不常见的结构 高能量 极罕见的结构 极高能量 从头预测法从头预测法原子间作用力 蛋白质的势能能量函数蛋白质的势能 基本步骤 选择蛋白质能量函数

15、模型 选择三维结构的表示方法 选择三维结构的评价函数 选择寻找最优结构的优化方法 关键问题 大规模非线性规划 大量的局部极小点 在计算时间和准确度之间寻找平衡 基于能量最小化的从头预测法非线性规划 最速下降法 牛顿法 共轭梯度法 全局优化方法 遗传算法 分解-结合法 离散化方法 最优化方法分子动力学方法 对蛋白质中原子间的作用力进行建模 用动力学方程跟踪蛋白质折叠时每个原子的位置 求解这些方程的解析解是极其困难的 用离散动力系统的方法来确定数值解 问题 模拟蛋白质折叠过程是非常消耗时间的 模拟 10-9 秒的蛋白质折叠过程大约需要一天时间 蛋白质的实际折叠时间大约在 10-4 秒的数量级或者更

16、多 需要超级计算机 新的趋势混合预测方法 在比较建模法和折叠识别法中使用从头预测法来预测部分难以找到模板的片断 在从头预测法中使用二级结构预测的结果和其他已知结构信息辅助建模 Meta-predictor 使用多个预测方法 对收集的结果进行综合比较和分析 改进收集的结果 本章小结重点介绍一些常用的蛋白质结构分析技术 获取蛋白质结构的实验方法 预测蛋白质结构的理论方法 蛋白质结构比对 蛋白质二级结构预测 蛋白质三级结构预测 随着蛋白质分析技术的不断深入,将促进我们从系统生物学的层次全面了解蛋白质的生物学功能Thanks for your attention!The end用Swiss-model分析如下序列,进行三级结构建模,取3个结果,并分析所得模型MSSGQCRSANAEDAQEFISDVERAIETLIIKNFHQSYSSVESNLAIGGKESTLTPSELRDLVTQQLLLKSSKPHLMPSNCGLEEKIASNLGSCKKNDSKLEEFRSFWAELLIGEAAKKSSVKLERPVRGH;

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 小学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁