激光网
当前位置: 首页 > 光学 > 正文

光学发明模仿人眼的图像处理能力

2024-02-13 14:16:56  来源:激光网原创    

在一个寒冷、阳光明媚的日子里,你开车在一条乡村公路上,周围是白雪皑皑的田野。在一瞬间,你的眼睛处理场景,挑选出要关注的单个物体——一个停车标志、一个谷仓——而场景的其余部分则在外围模糊不清。你的大脑将聚焦和模糊的图像存储为记忆,以后坐在办公桌前时可以在你的脑海中描绘出来。

宾夕法尼亚州立大学电气工程研究人员模仿人眼的这种简单、瞬时的图像处理能力,创造了一种超表面:一种类似于载玻片的光学元件,它使用以不同角度放置的微小纳米结构来控制光线。在宾夕法尼亚州立大学电气工程和计算机科学副教授倪兴杰的带领下,该团队在Nature Communications上发布了他们的发明。

研究人员表示,人工智能系统需要大量的计算能力和能量,并且在处理图像和识别物体方面可能很慢。相比之下,超表面可用于在图像被相机捕获之前对其进行预处理和转换,从而允许计算机和人工智能以最小的功耗和数据带宽处理它们。

超表面的工作原理是将图像从笛卡尔坐标系转换为对数极坐标系,后者使用类似靶心的像素分布。

“就像人眼内部光感受器的排列一样,超表面拍摄图像并将它们排列在对数极坐标系中 - 中心区域的像素密度更高,聚焦的特征像素更稀疏,”Ni说。“这样可以使照片中更重要的方面清晰地呈现出来,而其他方面则不那么对焦,从而节省了数据带宽。”

超表面被放置在相机的前面,以便光线首先通过它,并将笛卡尔系统的图像转换为对数极坐标,然后由相机数字化并传输到计算机。由于它使用弯曲光的纳米结构工作,因此超表面不需要任何功率并以光速工作。

“由于物体的图像在大小或方向上可以变化,因此需要对图像进行预处理,以使其能够抵抗缩放和旋转变化,”倪说。“这种预处理有助于人工智能应用程序更容易将它们识别为同一对象。

通过在相机前放置不同的超表面,研究人员还可以将对数极坐标图像转换回具有笛卡尔坐标的原始图像。

研究人员说,这项发明有许多潜在的应用,包括用于目标跟踪和监视,以绘制汽车如何在城市中移动。

“超表面可以与人工智能系统一起用作预处理器,从而更容易从多个街景摄像头中识别同一辆车,”倪说。“或者,如果它应用于卫星,它可能会跟踪飞机从起飞到着陆的整个过程。

除倪外,合著者还包括EECS前博士后学者Zingwang Zhang;Ziaojie Zhang,研究时是EECS的研究生;姚端,在宾夕法尼亚州立大学获得EECS博士学位;以及EECS的研究生Lidan Zhang。

免责声明: 激光网遵守行业规则,本站所转载的稿件都标注作者和来源。 激光网原创文章,请转载时务必注明文章作者和来源“激光网”, 不尊重本站原创的行为将受到激光网的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:133 467 34 45@qq.com