《最新应用R进行QSAR的尝试以PAHs在根际消解效果的QSARPPT课件.ppt》由会员分享,可在线阅读,更多相关《最新应用R进行QSAR的尝试以PAHs在根际消解效果的QSARPPT课件.ppt(22页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、应用应用R R进行进行QSARQSAR的尝试的尝试以以PAHsPAHs在根际消解效果在根际消解效果的的QSARQSAR第一届中国第一届中国R语言语言会议会议关于QSAR的背景定量构效关系定量构效关系(Quantitative Structure-Activity Relationship,简称QSAR)是指利用理论计算和统计分析工具来研究系列化合物结构与其效应之间的定量关系,即借助结构参数构建数学模型来描述化合物结构与活性之间的关系。2马斌:R在QSAR中的应用第一届中国第一届中国R语言语言会议会议第一届中国第一届中国R语言语言会议会议第一届中国第一届中国R语言语言会议会议第一届中国第一届中国
2、R语言语言会议会议第一届中国第一届中国R语言语言会议会议第一届中国第一届中国R语言语言会议会议第一届中国第一届中国R语言语言会议会议应用应用R进行进行QSAR的一个尝试的一个尝试以R进行多环芳烃(PAHs)在植物根际消解效果的QSAR分析为例子来说明R再QSAR中的应用。9马斌:R在QSAR中的应用第一届中国第一届中国R语言语言会议会议为什么研究多环芳烃(为什么研究多环芳烃(PAHs)10马斌:R在QSAR中的应用第一届中国第一届中国R语言语言会议会议数据库的建立数据库的建立活性参数是PAHs在植物根际消解效果,采用meta-analysis中常用的效应值(effect sizes,d)表示。
3、d=ln(E/C)分子结构参数通过Dragon 5(Talanet)计算得到965个结构参数,包括拓扑参数和理化参数。11马斌:R在QSAR中的应用第一届中国第一届中国R语言语言会议会议参数的筛选参数的筛选用主观选择对结构参数进行筛选,去掉所有值为恒量的参数,然后计算余下参数的相关系数矩阵,去掉相关系数大于等于0.95的两个参数中的一个。采用R极大提高筛选效率 12马斌:R在QSAR中的应用第一届中国第一届中国R语言语言会议会议R中结构参数的主观筛选(去除恒量)中结构参数的主观筛选(去除恒量)mol.structuredim.molanfor(k in 1:(dim.mol2-n)if(mol
4、.structure1,k=mol.structurea,k)+mol.structure-mol.structure,-k;+n-n+1;+kwrite.table(mol.structure,file=molstruc1.csv,sep=,)13马斌:R在QSAR中的应用第一届中国第一届中国R语言语言会议会议R中结构参数的主观筛选(去除高相关性参数)中结构参数的主观筛选(去除高相关性参数)cor.matrixdim.cormfor(i in 1:(dim.cor1-1)for(j in(i+1):(dim.cor2)if(cor.matrixi,j=0.95)+mol.structure-
5、mol.structure,-i;+idim(mol.structure)write.table(cor.matrix,file=matrix.csv,sep=,)write.table(mol.structure,file=molstruc2.csv,sep=,)14马斌:R在QSAR中的应用第一届中国第一届中国R语言语言会议会议PLS构建模型构建模型#modeling QSAR by PLSlibrary(pls)lnRdataQSAR#cross-validation the QSAR modelcrossvalRMSEPR2plot(crossval)plot(RMSEP)plot(R
6、2)plot(QSAR,ncomp=15)16马斌:R在QSAR中的应用第一届中国第一届中国R语言语言会议会议RMSE和和R2R2RMSE17马斌:R在QSAR中的应用第一届中国第一届中国R语言语言会议会议优化预测模型优化预测模型18马斌:R在QSAR中的应用第一届中国第一届中国R语言语言会议会议用于预测和预报用于预测和预报#predict unstudied compoundperylenenew.mol-predict(QSAR,type=response,newdata=perylene)输入还没有研究资料的输入还没有研究资料的perylene的结构参数,得到效应值为的结构参数,得到效应
7、值为-0.8619马斌:R在QSAR中的应用第一届中国第一届中国R语言语言会议会议结论与展望结论与展望R在QSAR分析中的最大特点是快捷和简便。QSAR的模型构建、验证和应用过程中都有多种方法可以选择,而这些方法目前都分布在不同的包中收集和整理各种常用的QSAR用到的方法,编写QSAR常用过程的函数,并开发出不断更新的包就尤为重要本文为R的QSAR包作出了一个开端20马斌:R在QSAR中的应用第一届中国第一届中国R语言语言会议会议致谢致谢感谢第一届R会议的所有贡献者本文的完成要感谢中国人民大学谢益辉的鼓励和杭州电子科技大学郑冰的大力帮助本文得到国家863计划(2007AA061101)、国家自然基金(40671092,20707020)和浙江省重点科技项目(2008C13024-3)的资助 21马斌:R在QSAR中的应用结束语结束语谢谢大家聆听!谢谢大家聆听!22