近日,上海交大电子信息与电气工程学院电子工程系智能光子学研究中心(CIP)樊昕昱教授、何祖源教授课题组提出了联合物理模型与数据驱动的神经网络训练策略,以小批量的训练数据集实现了高分辨率大带宽光谱重构神经网络的训练,且在长期测量中展示了良好的鲁棒性。相关成果以“Reconstructive Spectrum Analyzer with High-Resolution and Large-Bandwidth Using Physical-Model and Data-Driven Model Combined Neural Network”(使用联合物理模型与数据驱动的神经网络实现高分辨率大带宽的重构型光谱分析仪)为题发表于国际著名光学期刊《Laser & Photonics Reviews》。
研究背景
近年来,计算重构光谱测量仪因在小型化和高分辨率上展示了极大的优势而受到广泛关注。计算重构光谱测量仪工作过程中,待测光谱信息首先被编码至光斑图案中,然后使用重构算法从光斑图案中恢复出待测光谱。由于病态矩阵及不适定问题,常用的传输矩阵光谱重构算法通常难以实现高分辨率和大带宽的光谱重建。压缩感知和主成分分析法可分别实现大带宽和高分辨的光谱重建,然而这两类算法在计算过程中存在反复迭代导致计算速度较慢的问题。近年来,神经网络也被用于实现光谱信息重构,并在高分辨率和快速重建上展示出显著优势。但是,如何实现大带宽的光谱重建对于目前采用数据驱动训练策略的光谱重构神经网络来说仍然是一个巨大挑战。其主要原因在于,大数目的光谱输出通道往往需要庞大的训练数据集以及漫长的训练时间。
创新成果
上海交通大学智能光子学研究中心樊昕昱教授、何祖源教授团队针对这一问题提出了联合物理模型与数据驱动的光谱重建神经网络,仅需10µs时间下获得的小批量训练数据集即可完成具有2300个频谱输出通道的光谱重构神经网络的训练,且实现了3.2fm的分辨率。
联合物理模型与数据驱动的神经网络结构及训练数据:(a) 系统传输矩阵,(b) 提出的神经网络结构及训练过程
由于计算重构光谱测量仪中均存在校准过程,因此重构光谱测量仪的传输矩阵可被视为系统的已知信息。通过采用传输矩阵法作为系统的物理模型,将物理模型的误差引入神经网络训练过程中,可以降低对网络训练数据集大小的需求。物理模型的误差计算流程为:首先将网络输出的预估光谱重建结果经过传输矩阵法后得到预估的光斑图案,再计算预估的光斑图案与输入的真实光斑图案之间的均方误差。在数据驱动神经网络训练过程中,其损失函数大都仅为神经网络输出与标签数据之间的均方误差。本研究团队在数据驱动策略的基础上,在损失函数中进一步添加了物理模型误差,提出了联合物理模型与数据驱动的光谱重建网络,并用于基于回音壁光斑的波长计,实现了分辨率3.2fm和2300个输出频谱通道的光谱重建。所提出的网络训练数据集获取时间仅为10µs,并具备对训练数据集中未曾出现过的多波长光谱进行重建的能力。与传统的压缩感知和数据驱动神经网络相比,具有更好的重建精度以及长期测量过程中的鲁棒性优势。该工作展示了神经网络具备实现高分辨率与大带宽光谱重建的潜力,并且不再需要耗时费力的训练数据集获取过程。
版权声明:除特殊说明外,本站所有文章均为 字节点击 原创内容,采用 BY-NC-SA 知识共享协议。原文链接:https://byteclicks.com/51556.html 转载时请以链接形式标明本文地址。转载本站内容不得用于任何商业目的。本站转载内容版权归原作者所有,文章内容仅代表作者独立观点,不代表字节点击立场。报道中出现的商标、图像版权及专利和其他版权所有的信息属于其合法持有人,只供传递信息之用,非商务用途。如有侵权,请联系 gavin@byteclicks.com。我们将协调给予处理。