《材料计算||MatCloud+ 利用人工智能技术高效开发新型聚酰亚胺导热系数最高可比常规材料高出80%.docx》由会员分享,可在线阅读,更多相关《材料计算||MatCloud+ 利用人工智能技术高效开发新型聚酰亚胺导热系数最高可比常规材料高出80%.docx(12页珍藏版)》请在第一文库网上搜索。
1、【文献解读】利用人工智能技术高效开发新型聚酰亚胺,导热系数PJComputationalMaterials最高可比常规材料高出80%Corrected:PublisherCorrectionARTICLEOPENMachine-learning-assisteddiscoveryofpolymerswithhighthermalconductivityusingamoleculardesignalgorithmStephenWu,”YukikoKondo?,Masa-akiKakimoto3rBinYang4rHironaoYamada1,IsaoKuwajima3,GuillaumeLamb
2、ard3rKentaHongoQ?s,6rYibinu3,JunichiroShiomi3,7,ChristophSchick48,JunkoMorikawa3,9andRyoYoshida1,2,3Theuseofmachinelearningincomputationalmoleculardesignhasgreatpotentialtoacceleratethediscoveryofinnovativematerials.However,itspracticalbenefitsstillremainunproveninreal-worldapplications,particularly
3、inpolymerscience.Wedemonstratethesuccessfuldiscoveryofnewpolymerswithhighthermalconductivity,inspiredbymachine-learning-assistedpolymerchemistry.Thisdiscoverywasmadebytheinterplaybetweenmachineintelligencetrainedonasubstantiallylimitedamountofpolymericpropertiesdata,expertisefromlaboratorysynthesisa
4、ndadvancedtechnologiesforthermophysicalpropertymeasurements.Usingamoleculardesignalgorithmtrainedtorecognizequantitativestructurepropertyrelationshipswithrespecttothermalconductivityandothertargetedpolymericproperties,weidentifiedthousandsofpromisinghypotheticalpolymers.Fromthesecandidates,threewere
5、selectedformonomersynthesisandpolymerizationbecauseoftheirsyntheticaccessibilityandtheirpotentialforeaseofprocessinginfurtherapplications.Thesynthesizedpolymersreachedthermalconductivitiesof0.18-0.41WmK,whicharecomparabletothoseofstate-of-the-artpolymersinnon-compositethermoplastics.npjComputational
6、Materials(2019)5:66;httpsdoi.org10.1038s41524-019-0203-2关键词:分子设计机器学习高导热性聚酰亚胺日本国立统计数理研究所StephenWu博士等研究人员借助人工智能技术,让计算机学习已有数据,高效研发高导热高分子新材料。相关研究成果发表在Nature旗下计算材料领域顶级期刊npjComputationalMaterials上。背景:通过大量数据训练,人工智能可与人类匹敌,甚至超越人类,这种能力已经在多个领域智力要求较高的任务中得到了证明。因此,人们对通过使用机器学习(ML)开发新材料,最终节省大量时间和成本的兴趣越来越大。特别是,近年来ML
7、在分子设计方面取得了显著的进展。计算分子设计的目标是识别新的有应用前景的分子,其物理化学性质满足任意给定的要求。尽管ML在材料科学方面的潜力越来越大,但其实际价值尚未得到充分验证。据研究报道,目前机器学习研究的重点主要集中在算法的发展上,而对计算设计出的材料进行实验验证的工作则少得多。由于聚合物特殊性,通过机器学习设计聚合物,并实际合成和实验证实是前所未有的。这主要是因为聚合物特性数据的缺乏以及聚合物结构的复杂性和多样性。在这项研究中,通过ML算法设计(称为贝叶斯分子设计),成功地发现了具有高导热性的新型聚合物。这个证明研究旨在突出聚合物信息学中的一个有应用前途的新例子,并提出几个应解决的问题
8、,使ML得到广泛使用。目前很多研究者着重于聚合物重复单元中化学结构的设计。分子设计的目的是产生有应用前景的假设化学结构,这些结构可能表现出一组想要的性质。有机小分子包括多达1060个潜在的候选化合物,而目前已知化合物的总数最多为108o机器学习算法的出现,可以详尽地探索这一领域,可以为扩展广阔的化学宇宙的前沿做出重大贡献。在化学信息学的历史上,对计算分子设计进行了广泛的研究。它们的起源可以追溯到文卡塔苏布拉曼尼亚等人的开创性工作。这类研究大多数都集中在使用有限数量的化学结果及其随机重组,按顺序将起始化合物转化为预期目标。然而,这种方法大大缩小了设计范围。为了扩大搜索范围,近年来出现了更先进的基
9、于概率语言模型的ML技术。在以前工作中发展的贝叶斯方法也有助于这一领域的技术进步。尽管在计算分子设计的方法上有显著的创新,实现这一技术仍然有障碍。这些障碍主要来自于聚合物性能数据的数量非常有限,此外,设计候选材料的合成困难,专家知识和机器获取的知识之间的分歧,以及在实际应用中难以满足严格的要求也是主要影响因素。事实上,该研究团队使用的关于导热系数的实验数据集是有限的,因为它只有28个训练实例。如上所示,有限的训练数据使得机器学习方法无法预测。此外,作为一种二级张量,导热系数在聚合物加工操作中可能有很大的不同,例如复合薄膜和纺丝纤维,在这些操作中带来各向异性的分子取向。目前的数据库中并没有记录这
10、些变化。因此,该团队未能直接从给定的数据中推导出实用的预测模型。该团队设计的机器学习工作流是为了克服数据有限的问题。其中一个解决方案是利用与导热性相关的代理特性作为替代设计目标。在生成虚拟化学结构库的贝叶斯分子设计过程中,指定较高的玻璃化转变温度和熔化温度区域作为替代设计目标,为获得可靠的预测模型提供了足够的数据。从经验上知道,玻璃化转变温度较高的聚合物倾向于通过刚性结构来实现,从而导致更高的热导率。此外,考虑到聚合物的易于加工,通过剔除那些玻璃化温度极高的候选材料来选择设计候选材料。在此基础上,引入迁移学习的ML框架,对给定的小数据集进行热导率模型的求解。对于要从有限的数据中预测给定目标特性
11、,使用足够数量的数据对物理相关代理特性模型进行了预先训练,这些模型捕获了与预测热导率目标任务相关的公共特征。将这种机器获取的特征用于目标任务中,即使是在极小的数据集上,也能取得优异的预测精度。利用转移热导率模型,在以玻璃化转变和熔化温度为目标产生的虚拟库上筛选有希望的候选材料,然后进行实验室合成和热物理性能的实验表征。图1概述了本研究的分析流程。再现关键结果的R代码可在最后,在涉及合成可行性(SA)和易于加工的基础上,从1000个设计的候选化学结构中选择了三种化学结构,这是实际具有高导热性的聚合物所需要的。然后,利用合成化学家设计的反合成路线合成这些候选单体并进行聚合。合成的聚合物呈现出玻璃态
12、,其中两种经退火结晶。我们还观察了退火过程中由于附加的化学反应而引起的晶体体系的变化。在非晶和半晶状态下非复合热塑性塑料的导热系数达到高达0.41WmKo这一数值比自上世纪50年代以来已有广泛应用的常见聚合物聚酰亚胺高近80%。Post-screeningmodelsMonomer(S)Forwardpredictionp(YlProperties(Y)Tt:glasstransitiontemp.Fingerprint()Tm:meltingtemp.O-0C-01000101110BackwardpredictionPolymerdatabasePoLylnfoMonomerdatabas
13、eQM9Pre-trainedmodelsforrelatedpropertiesThermalconductivity(i)MonomerdesignGlasstransitiontemp.Meltingtemp.(ii)Post-screening Thermalconductivity LCP-likeliess Syntheticaccessibilityscore(iii)Laboratorysynthesis(iv)ExperimentalvalidationBayesianmoleculardesign图1基于机器学习(ML)的新型聚合物的从头设计和实验验证研究内容1.数据PoL
14、ylnfo是世界上最大的聚合物数据库。PoLylnf。已经根据结构重复单元记录了大约一百种聚合物的化学结构性质。将焦点缩小到数据库中的14,423种独特的均聚物,我们生成ML模型,以化学结构的函数来描述一组属性。我们总共提取了38310个关于热导率)、玻璃化转变温度(Tg)、熔化温度(Tm)和密度(p)的结构性能关系,如表1所示。表1对来自PoLylnfo和QM9的结构属性关系数据集及其使用分类的总结(VV7mK)06101620HUseDatabasePropertyNumberofstructuresNumberofsamplesMaxofwithin-polymerfluctuation
15、RangeoftemperatureCMD,TLPoLylnfo%591717r00130N/ACM。TLPoLylnfoTm323412,37430XN/ATLaPoLylnfoP151686130.50gcm310-35TLaQM9Cv133,805133f8850.97cal/molK25Post-screeningPoLylnfo283220.10W/mK10-35图2PoLyInfo数据的总结;a以升序记录聚合物的平均性能,误差条代表q(Q:标准偏差)。b散点矩阵,总结了五种聚合物特性的联合分布;cp为定压比热容Thermalconductivity(transferlearning)Thermalconductivity(directlearn