Advertisement

人工智能在材料科学的应用

阅读量:

人工智能在材料科学的应用

1. 绪论

在传统的新材料开发模式及相关工艺流程中,大量的人力物力资源投入且目标材料的产出往往需要经验和运气的配合。提高研发效率成为提升科研产出质量的关键指标,并非次要追求。伴随着人工智能技术在多个领域的卓越应用,在这种背景下越来越多的研究者将目光转向人工智能与传统材料科学的交叉领域,并取得了诸多创新性成果。

2016年5月,《自然》杂志(Nature)发布了一篇机器学习算法革新材料发现方式的论文,并将其置于封面上报道[1]:美国研究团队运用机器学习算法结合失败实验数据成功预测出新型材料,并且该算法的准确率超过了经验丰富的化学家。这一研究结果表明人工智能将彻底改变传统材料科学发现模式,并为开发新型材料提供了强有力的技术支持。

图 1‑1 2016年5月5日《Nature》封面

在同一个月份,《自然》新闻专题的封面文章也被登载了一篇题为《人工智能将创造更优秀的材料?》(《Can artificial intelligence create the next wonder material?》)[1].[2]的文章。该研究指出,在利用计算机建模与机器学习技术的情况下,在人们所需性能的基础上快速预测出相应候选材料的可能性大大提升。因此无需通过盲目试错的方式进行新材料的研发工作;相反地,则应根据计算机计算结果的具体指导进行新材料的有目标式合成与筛选工作从而显著加快了新材料研发的速度与效率。

在Web of Science数据库中于2020年7月通过检索"machine learning"和"deep neural networks"这两个关键词后对相关文献进行了筛选,在材料化学与能源领域一共发现了6335篇文献研究表明当前人工智能技术在材料科学领域的应用已日益成为研究关注的重点

图 1‑2 web of science数据库检索结果

2. 基于人工智能技术的材料科学研究的发展

2.1 材料科学的发展阶段

基于研究方法论的演进过程,则可将材料科学发展划分为四个主要阶段:经验探索期、理论构建期、计算模拟期以及智能时代引领期[1].[3]。

(1) 经验测试阶段

早期,在材料科学领域中,默认的研究方式多为经验性探究。该阶段的研究者通过对材料进行长期测试和实际应用等手段获得大量实践经验。在此阶段中,则需投入大量时间和精力进行反复试验工作才能实现预期目标;同时由于新材料生产周期较长且效率低下,在此过程中面临诸多挑战。

(2) 理论研发阶段

在各领域研究不断深入的情况下

(3) 计算模拟阶段

计算机应用领域的发展促使材料科学研究转向了计算模拟阶段,在这一过程中,多种数学建模技术的应用显著促进了材料科学研究的发展。

(4) 人工智能阶段

伴随着人工智能技术的发展与机器学习在材料科学领域的广泛应用, AI 技术与材料研发之间的融合日益紧密,并在材料设计领域扮演着至关重要的角色

2.2 材料科学在人工智能阶段的发展因素

当材料科学进入人工智能阶段时

(1) 充足的材料科学理论研究

人工智能技术的应用必须建立在相关应用领域坚实的理论基础之上。当研究者深入探索材料科学的理论时,越来越多地揭示了物理机制与材料结构及性能之间的内在联系,这不仅有助于深化对该领域基本规律的理解,也为后续工作奠定了可靠的基础。这些认识使得计算机借助于材料科学理论来准确模拟真实材料的结构及其性能成为可能,从而推动了相关领域的快速发展

(2) 多尺度、高通量的模拟计算软件与高效的计算能力

伴随着针对材料科学的模拟能力不断提升进步

(3) 规模化、系统化的材料数据库

基于材料基因工程的理念提出后, 逐步构建形成了一个覆盖全面的规模化和系统化的数据库, 并着重发展了数据共享机制、自动化收集与处理流程以及输出管理功能. 从一个方面来看, 这类数据库能够为大规模的人工智能实验和数据分析提供丰富的数据资源存储支持; 另一方面, 它们能够整合并优化人工智能计算所需的参数配置与模型训练过程中的关键指标分析.

3. 基于人工智能技术的材料科学研究的研究领域

基于人工智能技术的材料科学的主要研究方向包括材料逆向分析、新材料开发以及材料性能预测等方面。这三个研究方向直接关联于人工智能技术的应用过程:其中一个是数据挖掘阶段;另一个是模型训练与优化阶段;最后一个则是模型实际应用阶段。后续内容将通过具体实例介绍当前研究人员在上述三个领域的最新进展。

图 3‑1 基于人工智能技术的材料科学研究的研究领域的三个方面

2.1 逆向分析-数据的挖掘

针对逆向分析这一领域,在当前的研究过程中,研究者通过收集和整理材料数据信息,并对其进行深入的数据分析工作。从而从数据分析中提炼出具有实用意义的模式。例如不同材质特性间的关联关系,则能够进一步归纳形成新的知识体系。

该研究[5](《Semi-supervised machine-learning classification of materials synthesis procedures》)中提出了一种半监督学习方法。该方法能够通过书面自然语言对无机材料合成程序进行分类。该系统通过潜在的Dirichlet分配将关键术语自动归类到与特定实验材料合成步骤相对应的主题中(例如"研磨"与"加热"、"溶解"与"离心分离"等)。在少量注释的辅助下,随机分类算法能够将这些步骤与不同类型的材料合成过程(例如固态或水热合成)相关联。

研究表明,在合成流程图构建方面,通过使用实验步骤顺序的马尔科夫链模型能够恢复可能存在的合成程序逻辑框架。基于机器学习的方法开发出一种可扩展的技术框架,在文献分析中提取大量无机材料合成信息,并将其转换为标准化的机器可读数据库。

图 3‑2 通过马尔可夫链表示可以准确地重建可能的合成程序流程图

本研究利用机器学习技术分析文献中的沸石合成数据

图 3‑3 《从大量沸石材料合成记录中将合成和结构相联系》研究流程

3.2 新材料发现-模型的训练与优化

在新材料领域中,研究者基于构建相关的人工智能算法模型并输入丰富的材料数据,最终训练出具备材料设计能力的人工智能算法模型,以助于研究者探索与发现新型材料.

《基于过程-结构-性能互惠的弱监督学习关系提取》[7](《Relation extraction with weakly supervised learning based on process-structure-property-performance reciprocity》)中指出,在研究领域中研究人员通过融合物理与化学理论,并结合量子力学原理使计算机重新揭示变量间的关联

研究人员能够设定多种材料参数,并探索AI设计策略的影响。通过调整分子链长度或引入不同化学物质等实验条件变化进行测试时,在线计算机会提供相应的性能指标。每次迭代仅需极短时间内完成,在线计算机会提供相应的性能指标。与之相比,在线计算机会提供相应的性能指标的传统方法仍需投入数天甚至数周时间才能得出结论。

用户能够输入所需材料属性的需求,在线系统通过海量科学文章数据库搜索到与之匹配的产品信息。该系统通过这种简单的组合关系来优化和设计新型功能材料,并支持大规模批量生产这些具有相同高性能的新材料。人工智能技术使计算机能够快速高效地解决各种复杂问题,在当前水平下仅需投入相当于其能力的人力资源就可以完成同样的任务。

图 3‑4 《基于过程-结构-性能-性能互惠的弱监督学习关系提取》功能流程

在过去的文献研究中

该研究团队在《Discovering unusual structures from exception using big data and machine learning techniques》[8]中提出了一种创新方法,在持续优化机器学习模型利用海量数据进行训练的基础上实现了以下目标:精准预测材料结构与其性能之间的关联性(对应于发现材料发生变异或发生突变的可能性)。此外还首次关注那些超出现有预测能力范围的关键案例;深入分析这些关键案例(对应于发现材料发生变异或发生突变的可能性);从远离总体趋势的角度识别出具有特殊意义的关键结果;从而获得了对现有理论的新见解并发现了新型的基础物质单元——Ag+³离子基团这一新物质单元对基础物理化学理论的发展具有重要意义并推动了多学科交叉研究的发展

图 3‑5 《使用大数据和机器学习技术在异常中发现异常结构》研究流程

在本工作中,项目团队自行构建了一个包含HSE计算数据的材料结构数据库,并利用机器学习技术对材料结构中的间隙进行分析。随后重点阐述了机器学习如何作为一种工具识别这些特殊的案例,并探讨了传统分析方法在研究这些特殊案例中的应用。最终这一系列操作使得我们成功拓展了现有的科学知识范围。

在本工作中,研究团队仅采用了规模相对较小的数据集进行了训练,而机器学习模型的整体性能与现有研究相当一致,其决定系数R²值约为0.89.通过分析带隙预测模型的结果数据,研究团队从数据库中筛选出约4,000种化合物,并识别出其中34种具有显著特征的'例外'分子.在深入分析这些结果之后,其中有多种分子表现出独特的结构特征或其他异常特性,例如特殊的配位环境或氧化态状态,其带隙相对于同族其他化合物出现了突然性增加的情况,或者与其他相结构存在明显差异.

图 3‑6 机器学习预测带隙的结果

在那些预测误差较大的化合物中

图 3‑7 比较了 AgO₂F("异常")与 KAgO₂ 的电子结构。AgO₂F 因其独特的氧化态 (O²²⁻) 而表现出异常的行为。

3.3 材料预测-模型的应用

针对材料特性预测问题,在这一领域内的人工智能研究者们通过建立相关的人工智能算法模型并归纳得出各种材料的状态与性能之间的规律性关系。随后,在实际应用中,则基于所监测的数据对这些规律性关系进行分析。

太阳能被有机光伏(OPV)电池以高效且低成本的方式转化为了电能。近年来的研究表明,有机光伏(OPV)技术的发展速度已显著提升。当前研究的主要方向是探索新型有机光伏分子结构与其光电性能之间的关系。该研究过程主要包括以下内容:一是设计与合成新型有机光伏材料;二是通过表征其光电性能来评估材料的有效性;三是构建高效稳定的光伏电池组件。

这些传统的工艺路线往往需要严格调控多种化学反应过程, 搭建精密设备组, 经历耗时的纯化过程, 以及复杂的实验流程. 这些特点造成了高昂的成本投入与漫长的研发周期. 由此可见, OPV工艺开发效率低下且进展缓慢.

在《Machine learning–assisted molecular design and efficiency prediction for high-performance organic photovoltaic materials》[9]这篇论文中, 重庆大学的孙宽教授、中国科学院的陆仕荣教授和肖泽云教授共同创建了一个数据库,该数据库包含了从文献中收集的1719个经过实验验证的OPV供体材料.他们在研究分子表征对机器学习性能影响时,测试了包括图像表示法、ASCII字符串表示法、两类描述符以及七类分子指纹在内的不同表征形式.根据PCE值,描述符能够将材料划分为"低效"和"高效"两类.其中,指纹表现最佳,其预测PCE值的准确度达到81.76%,并且其长度对预测准确性具有显著影响.

此外,在实验室中采用了多种机器学习算法进行分类任务的研究工作取得了一定成果。研究结果表明,在处理小型数据库的情况下(即数据量较少时),随机森林(RF)模型表现出色,并且其性能优于其他模型。综上所述,在实验室中合成并测试了10种新的OPV供体材料以进一步验证该方法的有效性,并获得了理想的实验结果

此次研究项目中,作者成功构建了新的研究框架,在这一过程中他主要聚焦于利用机器学习算法筛选候选分子,并对这些分子进行详细分析。随后,在后续实验中采用虚拟评估技术对这些分子进行了进一步筛选和优化。这种创新性方法不仅提升了研究效率,在显著缩短了研发周期的同时也大幅提高了研究成果的质量

4. 基于人工智能技术的材料科学研究的问题与展望

4.1 基于人工智能技术的材料科学研究的现存问题

人工智能变革材料科学研究方法尚存在不少问题:

此方法受限于相关数据及影响因素等材料性能控制条件,在人工智能应用中目前仅能发挥有限作用。

二是由计算机模拟得出的物质模型,并不一定能在实验室实现其成功合成及大规模生产这一过程可能耗时很久

4.2 基于人工智能技术的材料科学研究的展望

针对当前存在的问题, 本文提出了两个主要的发展方向: 扩展材料数据库与加强新技术的应用

(1) 材料数据库的扩充

大量更为详细的信息资料库有助于缩短研发人员的研发周期以及降低研发成本。当前的材料研究主要思路在于通过对成分与工艺的优化组合实现目标材料的设计目标,并通过建立系统性的知识体系阐述成分、工艺、微结构及性能间的关联性来实现对相关参数的有效调控和精确预测。该数据库不仅能够帮助研究人员快速定位所需信息还能为新物质的设计提供理论依据从而推动相关领域的技术进步。

(2) 新技术的发展

新技术的重大进展与应用前景令人倍感期待。例如作为拥有26000年历史的重要材料之一陶瓷材料因其独特的热力学、机械及化学稳定性而广泛应用于多个领域然而其传统的烧结工艺能耗较高且存在长时间烧结的问题这一直成为制约其发展的重要因素尤其是由于烧结过程引发的成分挥发问题长期困扰着相关研究者对此UMD材料科学与工程系的科学家们进行了独创性研究并开发出一种超快高温烧结(UHS)陶瓷技术能够在不到10秒的时间内完成块体陶瓷生产将原本需要十几个小时才能完成的任务缩短至几秒钟这项创新方法不仅解决了实验计算与人工智能等技术在新材料发现中的关键瓶颈问题还为陶瓷制备工艺的发展开辟了新的方向

参 考 文 献

复制代码
1. Machine-learning-assisted materials discovery using failed experiments, Paul Raccuglia…, Nature volume 533, pages73–76(2016)
2. Can artificial intelligence create the next wonder material? (Nicola Nosengo., 2016, DOI: 1.19850)
3. Agrawal A, Choudhary A.Apt Mater/a/s[J],2016,4(5):1-17.
4. 王卓,王礞,雍歧龙,郭艳华,崔予文. 材料信息学及其在材料研究中的应用[J]. 中国材料进展,2017,36(02):132-140.
5. Semi-supervised machine-learning classification of materials synthesis procedures (npj Computational Materials, 2019, DOI: 10.1038/s41524-019-0204-1)
6. Linking synthesis and structure descriptors from a large collection of synthetic records of zeolite materials (Nat. Commun., 2019, DOI: 10.1038/s41467-019-12394-0)
7. Relation extraction with weakly supervised learning based on process-structure-property-performance reciprocity(Takeshi Onishi…, DOI: 10.1080/14686996.2018.1500852)
8. Discovering unusual structures from exception using big data and machine learning techniques(Jianshu Jie1…, DOI: 10.1016/j.scib.2019.04.015)
9. Machine learning–assisted molecular design and efficiency prediction for high-performance organic photovoltaic materials (Sci. Adv., 2019, DOI: 10.1126/sciadv.aay4275)

全部评论 (0)

还没有任何评论哟~