科学探索|将物理学教授给AI 可对材料属性有更深入的了解将物理学教授给AI|可对材料属

深度神经网络 (DNN) 在许多研究和商业环境中都取得了显著成就。但 DNN 是一种黑盒模型，并且不知道它们如何工作或为什么工作。通过运用基础物理知识以不同的方式指导或约束 DNN 的训练过程或网络架构，可以缓解传统 DNN 的一些局限性。
近日，来自杜克大学的研究人员已经证明，将已知的物理知识融入机器学习算法，可以帮助神秘的黑匣子获得新的透明度，并对材料属性有更深入的了解。
研究人员构建了一种现代机器学习算法——洛伦兹神经网络（Lorentz neural network，LNN），一种前馈神经网络，利用因果关系的物理约束来直接学习完全决定超材料电磁散射特性的电和磁响应函数。
该方法不仅使算法能够准确地预测超材料的特性，而且比以前的方法更有效，同时提供了新的见解。
该研究结果以“Learning the Physics of All-Dielectric Metamaterials with Deep Lorentz Neural Networks”为题，于 5 月 9 日发表在《Advanced Optical Materials》杂志上。

文章图片

杜克大学电气和计算机工程教授 Willie Padilla 说：“ 通过将已知物理学直接纳入机器学习，该算法可以在更少的训练数据和更短的时间内找到解决方案。虽然这项研究主要是展示该方法可以重现已知的解决方案，但它也揭示了一些以前没有人知道的非金属超材料的内部工作原理。”
超材料是一类具有特殊性质的人造材料，这些材料是自然界没有的。它们拥有一些特别的性质，而这样的效果是传统材料无法实现的。超材料的成分上没有什么特别之处，它们的奇特性质源于其精密的几何结构以及尺寸大小。
超材料由一个类似于乐高底板的大硅柱网格组成。根据圆柱体的大小和间距，超材料以各种方式与电磁波相互作用，例如吸收、发射或偏转特定波长。
图 1a 为这项工作中考虑的全电介质超材料 (ADM) 。圆柱体内部如图 1b 所示。

文章图片

图 1：ADM 。
在这里，研究人员试图建立一种称为神经网络的机器学习模型，以发现单个圆柱体的一系列高度和宽度如何影响这些相互作用。研究人员施加在神经网络上的物理特性称为洛伦兹模型——一组描述材料固有特性如何与电磁场共振的方程。模型不是直接跳到预测圆柱体的响应，而是学习预测洛伦兹参数，然后用于计算圆柱的响应。
物理信息 LNN 由一个前馈神经网络组成，具有四个大小为 (100-250-250-100) 的全连接隐藏层。输入层接收大小为 4 的几何向量 g，输出为洛伦兹振荡器的参数。其架构如图 2 所示。

文章图片

图 2：LNN 架构。
Padilla 实验室的博士后研究员 Omar Khatib 说：“当你让神经网络更具可解释性时，这在某种意义上是我们在这里所做的，微调可能更具挑战性。我们确实在优化培训以学习模式方面遇到了困难。”
然而，一旦模型开始工作，它就被证明比该小组为相同任务创建的先前神经网络更有效。特别是，该小组发现这种方法可以显着减少模型确定超材料特性所需的参数数量。
他们还发现，这种基于物理学的方法能够自行发现。
当电磁波穿过一个物体时，它在旅程开始时与它的交互方式不一定与结束时完全相同。这种现象被称为空间色散。由于研究人员必须调整空间色散参数以使模型准确工作，他们发现了他们之前不知道的物理过程。