《高分子材料基因组——高分子研发的新方法.docx》由会员分享,可在线阅读,更多相关《高分子材料基因组——高分子研发的新方法.docx(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、高分子材料基因组高分子研发的新方法新材料是高新科技和高端制造业发展的基石,而工业技术的 不断发展对材料性能提出了越来越高的要求.但是,新材料 的研发往往滞后,无法及时满足应用要求.为了加快材料研 发,结合现有的实践经验,2022年,研究者提出了新的材料 研发模式一一材料基因组.我国科技部于2022年启动了 “材 料基因工程关键技术与支撑平台”,重点扶持材料基因组的 研究27K43495Twoofthemostpromisingpolymermembranespredi ctedbythismachinelearningmodelexceededtheupperbound forC02/CH4s
2、eparationperformance. 526Find2838novelc opolymersthathavebetteroveralIperformancethanNaf ion 117forfullyhydratedmembranesat80C bymachinelearning models.537ProvideregressionmodeIstofacilitatethed evelopmentofadvancedfiltrationmembranesforpublicuse 548Usemachine1earningmodelstopredictpolymerizati onex
3、perimentsthatarelikelytoproducematerialswithtar getedpropertiesratherthanpredictthepropertiesofpoly mers. 559TrainmachinelearningmodeIsbysmalldata. 56运用机器学习模型筛选高分子材料具有预测准确度高,预测 过程方便快捷,方法泛用性强,无偏见等优点.这些优势完 美契合材料基因组对材料设计筛选过程中的需求.想要获得 可靠且准确的机器学习模型,必须依赖可靠、完备且庞大的 数据,然而高分子的实验数据来源分散、测试参数各异、性 能种类不完备,这导致研究者在所
4、研究的高分子领域中有较 大可能遇到可靠数据规模较小的不利情况.由此可见,高分 子数据质量参差不齐已成为机器学习方法在高分子材料基 因组中应用的最大障碍.目前,相关的研究往往需要研究者 手动收集文献和公开数据库中的实验数据,当面对实验数据 较为稀少的材料性能和材料类别时需要研究者运用DFT、MD 模拟等方法计算大量该材料的理论数据,将其作为进一步机 器学习的训练数据.机器学习在高分子材料基因组中虽然已有个别应用,但整体 上仍然停留在构建适用于高分子领域的机器学习阶段.例如: Olsen等在已有的SMILES基础上开发了专为描述高分子结构 的表达系统(BigSMILES) 35, Ponzoni等
5、为探索高分子领域 如何选择合适的特征作为模型的输入,分别使用特征选择法 和特征学习法进行特征的选择并对预测断裂拉伸强度模型 进行训练,最终发现两种方法相结合的预测模型效果最佳 38.此外,还有探索小数据机器学习的可行方案5658, 追求更高准确性的机器学习预测模型501之类的基础性 工作.但是,大部分的研究并未继续深入,没有将通过机器 学习预测模型筛选出的高分子结构付诸实验合成和验证.相 信在解决了阻碍应用的各种问题后(如数据质量、数据特征 选择、机器学习算法选择、合成可行性等),机器学习必然 会在高分子材料基因组中发挥重要的作用.3总结与展望3. 1高分子材料基因组现状和挑战在高分子领域,运
6、用材料基因组设计筛选新型高分子材料仍 然是前沿领域,有待科研人员进一步探索和完善.随着理论 和技术的进步,通过计算机提前预测高分子的各项性能已成 为可能.材料基因组合与高分子理论、计算模拟技术和基于 数据驱动的人工智能等相结合,高通量设计筛选新型高分子 材料的材料研发方式已取得初步成效.特别是在面对2种或2 种以上相互制约彼此矛盾的性能时,相较于传统实验试错法, 基于材料基因组的高分子材料设计筛选在成本和时间上凸 显优势.高分子材料基因组仍然处于起步阶段,有很多问题亟待解决. 目前,在面对难以计算或预测的宏观性能时,往往用易于计 算的特征量替代高代价的宏观性能计算,但这种策略在一定 程度上降低
7、了结果的准确性.此外,虽然无论是第一性原理 密度泛函理论还是分子动力学模拟,其计算代理量所消耗的 时间都远小于实验合成、表征所需时间,但是当面对海量高 分子代理量计算需求时,时间成本仍是限制研究者进一步探 索更大化学结构空间的主要原因.一旦机器学习预测模型训练完成,利用预测模型进行材料特 征量或性能的预测是一条耗时短、结果准确的途径.但这条 途径中最大问题是如何为机器学习预测模型的训练提供来 源可靠且数据量足够大的高质量数据集.由于高分子材料的 分子结构、聚集态结构、加工方式和测试条件的不同都将影 响材料性能,而文献中的数据质量参差不齐,个别数据甚至 存在空缺,因此用于机器学习的高分子材料性能
8、数据库往往 难以得到格式统一且量大、可靠的性能数据.这种可靠数据 的匮乏阻碍了机器学习模型准确性和泛化能力的提升.此外,由于高分子材料基因组所能探索的结构空间远大于已 有的实验合成经验空间,容易筛选出难以合成的高分子结构. 因此,在理性设计过程中,需要进一步考虑合成的便宜性, 优化筛选条件并与已有的实验合成经验有机结合,或者创建 基于机器学习的高分子合成路径预测方法,在筛选出高分子 结构的同时预测合理的合成路径.3. 2高分子材料基因组对高分子领域的反哺高分子材料基因组不仅提出了高效的高分子材料研发新模 式,而且对传统高分子科学的认知和材料基因组的扩展具备 重要的意义.在利用高分子材料基因组挖
9、掘优秀新型材料的过程中,对筛 选结果进行“基因分析即可获得“基因(通常为基团或 原子)与宏观性能之间的关系.这些或正相关、或负相关的关 系既能充实高分子领域第一范式,提高实验试错法的效率, 又能加深对高分子化学结构和宏观性能关系的认识.除了对筛选结构“基因分析外,机器学习本身也可能为我 们带来新的认知.在高分子材料基因组中,利用机器学习模 型预测高分子性能本质上是一个以数学角度而非化学角度 出发,以唯象的方式预测高分子性能的“黑匣子”.这种 “黑匣子”过程由于不受已有的高分子理论的束缚,最终可 能筛选获得违背已有认知的“反常高分子结构.这些被筛 选出的高性能“反常结构有可能成为高分子理论新的突
10、 破口.另一方面,利用物理学等专业知识对机器学习(特别是 深度学习)的“黑匣子过程进行解释性研究,理清“黑匣 子内部运作的因果关系,有助于理解性能变化的规律 62,高分子材料基因组的发展不仅对高分子领域有重要意义,对 于材料基因组这一新的材料研发模式也具备重要意义.高分 子领域具有众多金属、无机非金属和有机小分子领域没有的 特征,如高分子链结构、链构象、多分散性、高分子结晶特 征、高分子微相结构和亚稳态结构等,目前对高分子材料基 因组的研究仍未达到能全面包含这些特性的阶段,因此进一 步发展高分子材料基因组将有效拓展材料基因组的应用范 围,是对现有材料基因组的有益补充和拓展.3. 3高分子材料基
11、因组的发展方向根据当前材料基因组在高分子材料方面的发展情况,我们展 望了未来的发展重点.(1) 实现高通量实验:通过高通量实验一次性获得批量样品 将是一条行之有效且极具潜力的筛选途径.不同于利用计算 机“虚拟合成与表征材料”的特征代理量筛选法和机器学 习法,利用高通量实验设备在短时间内合成大批量的高分子, 并利用高通量表征技术快速便捷地获得所有高分子性能数 据的高通量实验法不仅能从数量庞大的高分子结构中筛选 出符合性能要求的新型材料,而且能为机器学习提供大量可 靠的实验数据.高通量制备技术已在金属领域取得了系统性 的发展,但在高分子领域还比较零散、不成体系.目前,已 报道的高通量高分子合成方法
12、如自动并行合成器、微波合成 器和喷墨打印机等.Ehm等成功利用商业化的自动并行合成 器一一平行压力反应器48(PPR48)实现烯炷聚合催化剂的高 通量筛选63. Zhang等则成功利用自己设计的设备对甲基 丙烯酸甲酯原子转移自由基聚合法催化体系的参数进行高 通量筛选和优化64.此外,Ducker等则利用微波多肽合成 器高通量改性硅表面性质65.相较于高通量制备技术,高 通量的表征技术发展缓慢,如高通量成分与结构表征技术、 高通量热力学表征技术、高通量力学表征技术、高通量光学 表征技术等,但其作为高通量制备技术的配套技术,对于提 高材料研发的整体效率意义重大.不同于高通量制备技术, 高通量表征技
13、术可以模糊材料的界限,应用于金属和无机非 金属材料的高通量表征技术可以较为容易的拓展到高分子 领域,因此高分子研究者可大力借鉴金属和无机非金属材料 的高通量表征技术.(2) 进一步发展特征量代替宏观性能的策略:一方面寻找更 多能代理宏观性能的特征量,从而将更多宏观性能纳入高分 子材料基因组的适用范围内,如耐溶剂性、耐磨性、抗冲击 性、相容性等等;另一方面引入更快速、便捷的方法计算特 征量,例如基团贡献法、分子连接指数法和机器学习等等.(3) 进一步发展包含性能更广且预测更准确的高分子材料宏 观性能机器学习预测模型:目前,机器学习预测模型往往只 针对特定类型高分子的特定性能,而限制机器学习在高分子 材料基因组中更广泛应用的是可靠数据的匮乏.因此,通过 建立完善规范的高分子材料性能数据库扩大有效数据量或 发展利用小数据进行机器学习的策略,从而建立能预测更多 性能且更准确的性能预测模型将是机器学习在高分子材料 基因组中未来发展的方向.(4) 发展基于机器学习高分子逆向设计策略:与正向设计将 材料结构参数映射到性能上获得性能预测模型不同,逆向设 计是将材料的性能映射到材料结构参数上获得逆向模型.在 实际的材料设计和工程应用环节,最重要的是满足工程对材 料性能的要求.因此,相较于正向设计,逆向设计作为从性 能出发获得材料结构的面向性能的设计更适合于工程领域.