激光网3月26日消息,一组研究人员使用人工智能来识别具有有利价值的热电材料。该小组能够驾驭人工智能的传统陷阱和大数据挑战,为人工智能如何彻底改变材料科学提供了一个典型的例子。详情已于2024年3月8日发表在《科学中国材料》杂志上。
“寻找合适材料的传统方法涉及反复试验,这既耗时又昂贵,”东北大学材料研究所副教授、该论文的通讯作者李昊说。“人工智能通过梳理数据库来识别潜在的材料,然后可以通过实验验证来改变这一点。”
尽管如此,挑战依然存在。大规模材料数据集有时包含误差,过拟合预测的温度相关属性也是一个常见误差。当模型学习捕获训练数据中的噪声或随机波动,而不是潜在的模式或关系时,就会发生过度拟合。
因此,该模型在训练数据上表现良好,但无法泛化新的、看不见的数据。在预测与温度相关的属性时,当模型遇到超出训练数据范围的新条件时,过拟合可能会导致预测不准确。
Li和他的同事们试图克服这一点,开发出一种热电材料。这些材料将热能转化为电能,反之亦然。因此,获得高度准确的温度依赖性至关重要。
“首先,我们采取了一系列理性行动来识别和丢弃可疑数据,从Starrydata2数据库获得了92291个数据点,包括7295种成分和不同的温度,”李说。
然后,研究人员使用梯度提升决策树方法构建了机器制造模型。该模型在2023年发布的训练数据集、测试数据集和新增样本外实验数据上分别取得了0.89、~0.90和~0.89的显著R2值,证明了模型对新可用材料的预测准确性。
“我们可以使用这个模型对材料项目数据库中的稳定材料进行大规模评估,预测新材料的潜在热电性能并为实验提供指导,”WPI-AIMR助理教授、该论文的合著者Xue Jia说。
最终,该研究说明了在机器学习中的数据预处理和数据拆分方面遵循严格准则的重要性,以便解决材料科学中的紧迫问题。研究人员乐观地认为,他们的策略也可以应用于其他材料,如电催化剂和电池。