《药物设计学第五章药物发现的虚拟筛选方法.ppt》由会员分享,可在线阅读,更多相关《药物设计学第五章药物发现的虚拟筛选方法.ppt(24页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第五章第五章 药物发现的虚拟筛选方法药物发现的虚拟筛选方法化学信息学化学信息学生物信息学生物信息学虚拟筛选虚拟筛选先导物先导物化学生物学化学生物学候选药物候选药物靶点大分子靶点大分子第一节第一节 概述概述虚拟筛选:针对重要疾病特定靶标生物大分子的三维结构或虚拟筛选:针对重要疾病特定靶标生物大分子的三维结构或定量构效关系定量构效关系(QSAR)(QSAR)模型,从现有小分子数据库中,搜寻与模型,从现有小分子数据库中,搜寻与靶标生物大分子结合或符合靶标生物大分子结合或符合QSAR QSAR 模型的化合物,进行实验筛模型的化合物,进行实验筛选研究。选研究。虚拟筛选流程虚拟筛选流程基于分子对接虚拟筛选
2、流程基于分子对接虚拟筛选流程SARSSARS爆发,从现有药物中快速筛选,老药,安全,直接进临爆发,从现有药物中快速筛选,老药,安全,直接进临床。床。SARSSARS冠状病毒冠状病毒(SARS-CoV)(SARS-CoV)蛋白水解酶蛋白水解酶(Mpro)(Mpro)的同源蛋白模拟的同源蛋白模拟结构;结构;虚拟筛选现有药物库虚拟筛选现有药物库MDL/CMC(http:/ Mpro SARS-CoV Mpro 的抑的抑制剂;制剂;(A)(A)肉桂硫胺的化学结构;肉桂硫胺的化学结构;(B)(B)肉桂硫胺与肉桂硫胺与SARS-CoV MproSARS-CoV Mpro活性位点的作用方式活性位点的作用方式
3、(绿线:(绿线:-NH-NH或或-CH-CH氢键相互作用;红线:氢键相互作用;红线:-CH-CHO O 氢键相互作用;蓝线:氢键相互作用;蓝线:C145 C145 的巯基的巯基(-SH)(-SH)与肉桂硫胺的与肉桂硫胺的C=C C=C 双键作用双键作用酶水平抑制活性酶水平抑制活性IC50 IC50 为为5.0M5.0M,能抑制病毒颗粒的,能抑制病毒颗粒的复制;复制;细胞水平抑制细胞水平抑制SARS-CoV SARS-CoV 的的活性为活性为31M31M;是冠状病毒;是冠状病毒Mpro Mpro 的专一性抑制剂。的专一性抑制剂。第二节第二节 化学信息处理化学信息处理一、化学信息的表示方法一、化学
4、信息的表示方法1 1、一维结构表示、一维结构表示SMILESSMILES编码的立体化学信息表示编码的立体化学信息表示第二节第二节 化学信息处理化学信息处理一、化学信息的表示方法一、化学信息的表示方法2 2、二维结构表示、二维结构表示用图表示苯丙氨酸的结构用图表示苯丙氨酸的结构(1 1)图论基础和图的矩阵表示)图论基础和图的矩阵表示第二节第二节 化学信息处理化学信息处理一、化学信息的表示方法一、化学信息的表示方法2 2、二维结构表示、二维结构表示乙醛的邻接矩阵表示和矩阵简化步骤乙醛的邻接矩阵表示和矩阵简化步骤(2 2)化合物结构的矩阵表示)化合物结构的矩阵表示两个原子间有键相两个原子间有键相连,
5、矩阵元素为连,矩阵元素为1 1第二节第二节 化学信息处理化学信息处理一、化学信息的表示方法一、化学信息的表示方法3 3、三维结构表示三维结构表示甲烷立体结构的笛卡儿坐标系统甲烷立体结构的笛卡儿坐标系统原子坐标随坐标原点、原子坐标随坐标原点、分子的摆放位置而变分子的摆放位置而变1 1,2-2-二氯乙烷的内坐标系统二氯乙烷的内坐标系统描述分子中原子描述分子中原子和键的相对位置和键的相对位置第二节第二节 化学信息处理化学信息处理一、化学信息的表示方法一、化学信息的表示方法常见的分子存储格式常见的分子存储格式(1 1)MolMol格式文件格式文件(2 2)SDFSDF格式文件格式文件第二节第二节 化学
6、信息处理化学信息处理二、化合物数据库的生成二、化合物数据库的生成ISISISIS信息管理系统信息管理系统化学信息管理系统(化学信息管理系统(ISIS/HostISIS/Host)化学信息生成和管理软件(化学信息生成和管理软件(ISIS/BaseISIS/Base)化学绘图软件(化学绘图软件(ISIS/DrawISIS/Draw)第二节第二节 化学信息处理化学信息处理二、化合物数据库的生成二、化合物数据库的生成1 1、化合物数据库的生成、化合物数据库的生成2 2、三维结构数据库、三维结构数据库19871987年出现年出现CONCORDCONCORD程序,第一个能把二维连接表转换成三维坐程序,第一
7、个能把二维连接表转换成三维坐标标,摆脱了三维结构信息的来源限制摆脱了三维结构信息的来源限制,使任何拥有二维分子数据使任何拥有二维分子数据库的实验室和公司都可以建立自己的三维结构数据库。之后产库的实验室和公司都可以建立自己的三维结构数据库。之后产生生Chem-XChem-X、COBRACOBRA、CORINACORINA和和MOLGEOMOLGEO等一些三维结构转换程序。等一些三维结构转换程序。利用利用CONCORDCONCORD程序得到的三维结构数据库有:程序得到的三维结构数据库有:FCD-3DFCD-3D、MDDR-3DMDDR-3D、CMC-3DCMC-3D、CASRFCASRF、CAST
8、-3DCAST-3D、Pomona-92CPomona-92C目前,各大制药公司和分子设计公司建立的三维结构数据库有:目前,各大制药公司和分子设计公司建立的三维结构数据库有:ACD-3DACD-3D、SYBYL-3DBSYBYL-3DB、Chem-3DBSChem-3DBS、NCI-3DNCI-3D。剑桥结构数据库(剑桥结构数据库(CSDCSD):小分子晶体结构):小分子晶体结构布鲁克海文国家实验室蛋白质数据库(布鲁克海文国家实验室蛋白质数据库(PDBPDB):大分子晶体结构):大分子晶体结构蛋白质结构的蛋白质结构的4 4个层次:个层次:一级结构:组成蛋白质的氨基酸序列;一级结构:组成蛋白质的
9、氨基酸序列;二级结构:骨架原子间的相互作用形成的局部结构,二级结构:骨架原子间的相互作用形成的局部结构,如如alphaalpha螺旋,螺旋,betabeta片层和片层和looploop区等;区等;三级结构:二级结构在更大范围内堆积形成的空间三级结构:二级结构在更大范围内堆积形成的空间结构;结构;四级结构:主要描述不同亚基之间的相互作用。四级结构:主要描述不同亚基之间的相互作用。第三节第三节 生物信息处理生物信息处理一、序列分析一、序列分析1 1、单个序列分析、单个序列分析酪氨酸磷酸酶的蛋白质序列酪氨酸磷酸酶的蛋白质序列酪氨酸磷酸酶的二酪氨酸磷酸酶的二级结构,其中级结构,其中H H 代代表螺旋,
10、表螺旋,E E 代表折代表折叠,叠,B B表示表示桥,桥,G G表示表示310310螺旋,螺旋,I I表表示示螺旋,螺旋,T T表示氢表示氢键转角,键转角,S S代表转向,代表转向,图图7.17.1(c c)显示的)显示的是该。是该。一、序列分析一、序列分析1 1、单个序列分析、单个序列分析2 2、双重序列比较、双重序列比较序列对比序列对比3 3、多重序列比较、多重序列比较序列对比序列对比鼠和小龙虾的胰蛋白酶鼠和小龙虾的胰蛋白酶MouseIVGGYNCEENSVPYQVSLNS-GYHFCGGSLINEQWVVSAGHCYK-SRIQVCrayfishIVGGTDAVLGEFPYQLSFQET
11、FLGFSFHFCGASIYNENYAITAGHCVYGDDYENPSGLQI*MouseRLGEHNIEVLEGNEQFINAAKIIRHPQYDRKTLNNDIMLIKLSSRAVINARVSTISLPTACrayfishVAGELDMSVNEGSEQTITVSKIILHENFDYDLLDNDISLLKLSGSLTFNNNVAPIALPAQ|-S-S-|MousePPATGTKCLISGWGNTASSGADYPDELQCLDAPVLSQAKCEASYPG-KITSNMFCVGFLECrayfishGHTATGNVIVTGWG-TTSEGGNTPDVLQKVTVPLVSDAECRDDYGAD
12、EIFDSMICAGVPE+*|-S-S-|MouseGGKDSCQGDSGGPVVCNG-QLQGVVSWGDGCAQKNKPGVYTKVYNYVKWIKNTIAANCrayfishGGKDSCQGDSGGPLAASDTGSTYLAGIVSWGYGCARPGYPGVYTEVSYHVDWIKANAV-数据库数据库说明说明1J1E#f.Q8U5网址链接网址链接PDB5&/蛋白质三维结构*S!i%h7*s7L)R6khttp:/www.rcsb.org/pdbSWISS-PROT#n;蛋白质序列数据库7A,.d6,H8qhttp:/kr.expasy.org/sprot/PIR#蛋白质序列数据库h
13、ttp:/pir.georgetown.edu/6u;x/S8p2m4E;c*_7W)dOWL非冗余蛋白质序列http:/www.bioinf.man.ac.uk/dbbrowser/OWL/57:c/q0e7lEMBL核酸序列数据库!http:/www.embl-heidelberg.de/TrEMBLEMBL的翻译数据库http:/kr.expasy.org/sprot/,L&E$a8G(p2I0C+wGenBANK/y3s-i0:?9(v%6S:n核酸序列数据库http:/www.NCBI.nih.gov/Genbank/PROSITE3R,B/_7p7i-K/U蛋白质功能位点:O*d4
14、A-D/Tt;p6l65M,Shttp:/kr.expasy.org/prosite/9d41a8?8V;?SWISS-MODEL!f)&F,#sW8)f从序列模建结构/S2k,&n,o1|http:/www.expasy.org/swissmod/SWISS-MODEL.html$3J+Y#X%pSWISS-3DIMAGE三维结构图示http:/us.expasy.org/sw3d/DSSP蛋白质二级结构参数http:/www.cmbi.kun.nl/gv/dssp/*6dd&stXFSSP已知空间结构的蛋白质家族http:/www.ebi.ac.uk/dali/fssp/fssp.html
15、SCOP蛋白质分类数据库http:/scop.mrc-lmb.cam.ac.uk/scop/&r9S&E/V&Y:lCATH2Z5o*;A6E-y&_蛋白质分类数据库;e7nq#$h&r3?132R(bhttp:/www.biochem.ucl.ac.uk/bsm/cath/Pfam蛋白质家族和结构域Y.t1s5bh!;d.I%Ahttp:/pfam.wustl.edu/二、蛋白质折叠与三维结构预测二、蛋白质折叠与三维结构预测从头(从头(ab initioab initio)预测法)预测法穿针引线穿针引线(threading)(threading)法法同源模建(同源模建(homology mo
16、delinghomology modeling)法)法蛋白质的空间结构信息蕴涵于氨基酸序列中。蛋白质的空间结构信息蕴涵于氨基酸序列中。蛋白质预测工作的理论基础:系统的稳定状态通蛋白质预测工作的理论基础:系统的稳定状态通常是能量最小的状态常是能量最小的状态酪氨酸磷酸酶的折叠结构酪氨酸磷酸酶的折叠结构1.1.寻找同源模板:分辨率,有否晶体寻找同源模板:分辨率,有否晶体X-X-射线射线衍射结构,衍射结构,BLAST SCOREBLAST SCOREG G蛋白偶联受体(蛋白偶联受体(GPCRGPCR):牛视紫质():牛视紫质(PDBPDB)2.2.用用T-COFFEET-COFFEE计算计算,确定目标
17、和模板之间一确定目标和模板之间一级序列氨基酸残基间的对应位置级序列氨基酸残基间的对应位置第四节第四节 虚拟筛选虚拟筛选三维结构数据库搜寻三维结构数据库搜寻 相应的三维结构搜索软件促进了三维结构搜索的发展相应的三维结构搜索软件促进了三维结构搜索的发展,使使三维结构搜索方法真正走向实用。三维结构搜索方法真正走向实用。输入药效团结构,在三维结构数据库中搜索含有该药效团输入药效团结构,在三维结构数据库中搜索含有该药效团的分子;的分子;搜索到的分子有可能具有药效团所对应的某种生物活性,搜索到的分子有可能具有药效团所对应的某种生物活性,它可以在实验筛选之前为分子的生物活性作可能性预报;它可以在实验筛选之前
18、为分子的生物活性作可能性预报;当搜索结果中有一些分子,与已知活性的分子结构不同,当搜索结果中有一些分子,与已知活性的分子结构不同,意味着可能发现先导物。意味着可能发现先导物。数据库的分子是已经存在的化合物,合成方法已知,甚至数据库的分子是已经存在的化合物,合成方法已知,甚至已成为商品,可直接购买较快地进入生物测试阶段,提高新已成为商品,可直接购买较快地进入生物测试阶段,提高新药开发的效率。但化合物结构全部来自药开发的效率。但化合物结构全部来自X X射线晶体衍射和中子射线晶体衍射和中子衍射实验,三维结构搜索发展缓慢。衍射实验,三维结构搜索发展缓慢。基于配体的数据库搜寻方法:基于配体的数据库搜寻方
19、法:根据药效基团(根据药效基团(PharmacophorePharmacophore)模型进行三维)模型进行三维结构数据库搜寻。结构数据库搜寻。HIVproteaseinhibitorsHH4.1-6.1 4.4-6.4 1.8-3.8 建立一系列活性分子的药效构象;建立一系列活性分子的药效构象;抽提出共有的药效基团;抽提出共有的药效基团;在现有的数据库中寻找符合药效基在现有的数据库中寻找符合药效基团模型的化合物。团模型的化合物。比较著名的软件有:比较著名的软件有:CatalystCatalyst(应用普遍)(应用普遍)UnityUnity分子对接法(分子对接法(DockingDocking)
20、:):将小分子配体对接到受体的活性位点,搜寻其合理的取将小分子配体对接到受体的活性位点,搜寻其合理的取向和构象,使得配体与受体的形状和相互作用的匹配最佳。向和构象,使得配体与受体的形状和相互作用的匹配最佳。在药物设计中,分子对接方法主要用来从化合物数据库在药物设计中,分子对接方法主要用来从化合物数据库中搜寻与受体生物大分子有较好亲和力的小分子,从而发现中搜寻与受体生物大分子有较好亲和力的小分子,从而发现全新的先导化合物。分子对接由于从整体上考虑配体与受体全新的先导化合物。分子对接由于从整体上考虑配体与受体的结合效果,所以能较好地避免其他方法中容易出现的局部的结合效果,所以能较好地避免其他方法中
21、容易出现的局部作用较好,整体结合欠佳的情况。作用较好,整体结合欠佳的情况。目前具代表性的分子对接软件:目前具代表性的分子对接软件:DOCK DOCK、F1exX F1exX 和和 GOLD GOLD。基于受体(基于受体(ReceptorReceptor)的数据库搜寻方法)的数据库搜寻方法对接问题:受体的结构已知,设计可置于受体的连接对接问题:受体的结构已知,设计可置于受体的连接腔里,形成低内能受体腔里,形成低内能受体-药物复合物的小分子药物。药物复合物的小分子药物。对接问题的限制对接问题的限制 :迄今为止,采用:迄今为止,采用X-X-射线衍射结晶法或核磁射线衍射结晶法或核磁共振技术详尽研究过的
22、受体数量较少,大部分受体的三维结共振技术详尽研究过的受体数量较少,大部分受体的三维结构不清楚。构不清楚。三维结构搜寻的搜寻算法三维结构搜寻的搜寻算法是一个连续的多步骤过程是一个连续的多步骤过程,一般包括初筛、几何查找和柔性构象一般包括初筛、几何查找和柔性构象搜索三个步骤:搜索三个步骤:1、初筛:主要筛去不可能与提问结构匹配的分子,节约时间。大多数搜索系统把在药效团中出现频率较高的原子和基团作为筛子,每一个筛子对应一个编码,如果在提问结构中出现的编码也出现在被查找分子中,那么该分子通过初筛,否则被淘汰。2、通过初筛的分子需要接受严格的二维子几何结构查找,以确定原子之间的连接方式是否与提问结构匹配。3、柔性构象搜索与提问结构匹配的分子,要满足二维子结构匹配、提问结构中的空间限制(三维匹配)。1996年,采用 Chem3DB-3D(1994年7月版本)和NCI-3D数据库,搜索新型HIV-1蛋白酶抑制剂,获得2368个命中结构,其中1200个有库存样品,从中选取50个结构多样、新、有疏水区的化合物进行测试,发现活性最高的两个结构。