当前位置：首页 > 光学 > 正文

对光传播进行编程可创建高效的神经网络

2024-01-26 11:16:37　来源：激光网原创　

当前的人工智能模型利用数十亿个可训练参数来实现具有挑战性的任务。然而，如此大量的参数会带来高昂的成本。训练和部署这些庞大的模型需要巨大的内存空间和计算能力，而这些能力只能由机库大小的数据中心提供，这些数据中心消耗的能源相当于中型城市的电力需求。研究界目前正在努力重新思考相关的计算硬件和机器学习算法，以可持续地保持人工智能的发展速度。

神经网络架构的光学实现是一种很有前途的途径，因为单元之间连接的实现功耗很低。《Advanced Photonics》杂志上报道的新研究将多模光纤内的光传播与少量数字可编程参数相结合，并使用可编程参数超过100倍的全数字系统在图像分类任务中实现相同的性能。该计算框架简化了内存需求，减少了对能源密集型数字过程的需求，同时在各种机器学习任务中实现了相同水平的精度。

这项开创性工作的核心由洛桑联邦理工学院的Demetri Psaltis教授和Christophe Moser教授领导，其核心在于通过一种称为波前整形的技术精确控制多模光纤内的超短脉冲。这允许以微瓦的平均光功率实现非线性光学计算，这是实现光学神经网络潜力的关键一步。“在这项研究中，我们发现，通过一小组参数，我们可以从光学器件提供的权重库中选择一组特定的模型权重，并将其用于目标计算任务。这样，我们就将自然发生的现象用作计算硬件，而无需制造和操作专门用于此目的的设备，“该工作的主要合著者Ilker Oguz说。

这一结果标志着在应对对大型机器学习模型的需求不断升级所带来的挑战方面迈出了一大步。通过利用光通过多模光纤传播的计算能力，研究人员为人工智能中的低能耗、高效硬件解决方案铺平了道路。正如所报告的非线性光学实验所展示的那样，该计算框架还可用于有效地编程不同的高维非线性现象以执行机器学习任务，并可以为当前人工智能模型的资源密集型性质提供变革性的解决方案。

免责声明： 激光网遵守行业规则，本站所转载的稿件都标注作者和来源。激光网原创文章，请转载时务必注明文章作者和来源“激光网”，不尊重本站原创的行为将受到激光网的追责，转载稿件或作者投稿可能会经编辑修改或者补充，如有异议可投诉至：Email：133 467 34 45@qq.com