《化学键参数-数据挖掘方法及其应用.ppt》由会员分享,可在线阅读,更多相关《化学键参数-数据挖掘方法及其应用.ppt(19页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 化学键参数化学键参数-数据挖掘数据挖掘方法及其应用方法及其应用陆文聪上海大学理学院化学系1.原子参数模式识别方法 陈念贻:原子参数-模式识别方法是一种半经验方法,它要求用能描述有关物系的原子参数集张成多维空间,将已知物系的知识记于其中,然后用模式识别方法总结出数学模型,进而用以预报未知物系的性质。1.1 原子参数模式识别方法n原子参数 有关原子的电负性、半径、价电子数及其函数等n模式识别方法 主成分、Fisher判别法、球形映照、超多面体投影、最佳投影等1.2 原子参数模式识别方法应用举例(1)二元合金的晶型识别(2)三元合金相的形成判据图1:二元合金的NaZn13晶型的模式识别(I区是Na
2、Zn13晶型的形成区)例1:二元合金的晶型识别例2:含Ag三元合金的形成条件6图2:含Ag三元合金的模式识别(O)形成三元合金;(-)非三元合金Y=-0.40R1 0.19R2 0.22V1+0.092V2+0.66 X1 0.533X2+1.42 0.62.化学键参数数据挖掘方法n化学键参数 包括原子参数、分子参数;实验参数、理论参数(量子化学参数、分子拓扑指数、分子连接性参数)n数据挖掘方法 包括模式识别法、人工神经网络法、支持向量机法、集成学习法等2.1 常用化学键参数量子化学程序计算参数n能量参数 HOMO、LUMO、总能量、键能n几何参数 键长、键角n电性参数 电荷分布、Mullik
3、en布居 n疏水参数 2.2 常用数据挖掘方法Data MiningTechniquesSupport Vector MachineVisualizationEnsemble learningArtificial Neural NetworkGenetic AlgorithmsDecision TreesRough SetBayes netPattern Recognition2.2.1 支持向量机方法的几个主要优点 和局限性优点:n结构风险最小,全局最优n既能定性又能定量建模和预报n巧妙地运用核函数,解决了“高维”和“非线性”数据处理问题n变量数可以大于样本数,成功地解决了过拟合的控制问题,
4、提高了预报能力局限性:n核函数及其参数的选取和优化工作计算量大n小样本集的统计意义2.2.2 集成学习方法的几个主要优点和局限性优点:nAdaBoost侧重错分点,Bagging侧重平均化n模型个体可以用弱学习器,避免过拟n集成模型更加精确,稳定性更好局限性:可选模型及其排列组合太多,模型个体的选取尚无理论指导。2.3 化学键参数数据挖掘方法应用举例(1)复氯化物的钙钛矿结构的识别(2)二元半导体禁带宽度的预报例例1 复氯化物的钙钛矿结构复氯化物的钙钛矿结构图图3 3:复氯化物的钙钛矿结构的最佳投影识别图:复氯化物的钙钛矿结构的最佳投影识别图“1 1”:钙钛矿结构钙钛矿结构 “2 2”:其它结
5、构其它结构 化学键参数:离子半径、电负性、容许因子t(几何效应参数)、Dq(配位场效应对中心离子影响的能量差)例2:二元半导体禁带宽度预报二元半导体禁带宽度预报图图4 4 二元半导体禁带宽度预报(数据挖掘方法:支持向量机回归;二元半导体禁带宽度预报(数据挖掘方法:支持向量机回归;特征参数:价电子数、质子数、电负性、电荷半径比)特征参数:价电子数、质子数、电负性、电荷半径比)例3:ABO3型钙钛矿离子导体 导电性能研究n量子化学参数P/L P/L定义为钙钛矿内部八面体结构上O-O键平均电荷布居数与O-O键长的比值。图图5:掺杂掺杂与与纯钙钛矿导电纯钙钛矿导电能力能力Ln()与P/L之间的关系之间的关系例3:ABO3型钙钛矿离子导体 导电性能研究 用泛化能力较好的SVR(支持向量回归)模型总结了117个钙钛矿型离子导体的Ln()与其化学键参数之间的定量关系,为寻找更优异的钙钛矿型氧离子导体提供了线索。例3:ABO3型钙钛矿离子导体 导电性能研究18Thank youWelcome to Shanghai UniversityEmail:cell phone:15921033252http:/ you