激光网
当前位置: 首页 > 人工智能 > 正文

研究人员声称使用多模态3D网络改进了小物体检测

2024-01-11 15:17:48  来源:激光网原创    

一组学术研究人员开发了动态点-像素特征对齐网络,称为DPPFA-Net,以解决机器人和自动驾驶汽车准确检测小物体的问题。与其他现有的 3D 目标检测方法相比,该模型在平均精度方面表现出显着提高,在各种噪声条件下实现了 7.18% 的提高。

汽车制造商一直在为Genesis GV60等车辆添加面部生物识别技术,用于车门解锁,尽管智能汽车开发人员在满足自动驾驶汽车计算机视觉要求所需的光学传感器种类上持不同立场。关于其他应用需要哪种相机的共识可能决定了开发人员必须使用的成像系统。

尽管对自动驾驶汽车和机器人自动化解决方案的需求不断增长,但目标检测仍然是人工智能工作负载中的一项复杂任务。这一挑战的一个关键方面涉及使用LiDAR传感器,该传感器可生成3D点云,提供有关周围环境的深度信息。然而,LiDAR 数据容易受到噪声的影响,可能会导致物体检测错误。

为了解决这个问题,由日本立命馆大学的Hiroyuki Tomiyama教授领导的团队引入了一种多模态3D物体检测方法,该方法将3D LiDAR数据与标准相机捕获的2D RBG图像相结合。该研究强调了它在机器人领域的重要性,因为它使机器人能够更好地理解和适应环境。

“我们的研究可以促进机器人更好地理解和适应其工作环境,从而可以更精确地感知小目标,”Tomiyama解释说。“这些进步将有助于提高机器人在各种应用中的能力。

所提出的系统包括几个模块:基于内存的点像素融合模块、可变形点像素融合模块和语义对齐评估器模块。这些不同的专用模块被集成在一起,以提高以潜在环境噪声为特征的复杂场景中物体检测的准确性和鲁棒性。

基于内存的点像素融合模块促进了同一模态内以及不同模态内特征之间的交互。该模块利用 2D 图像作为存储区,使网络能够学习和适应 3D 点云数据中的噪声。相比之下,可变形的点-像素融合模块专注于特定像素位置的相互作用,在保持高分辨率的同时保持较低的计算复杂性。

“DPPF模块基于采样策略专门与关键位置像素建立交互。这种设计不仅保证了较低的计算复杂度,而且还实现了自适应融合功能,特别有利于高分辨率图像。SAE模块保证了融合特征的语义对齐,从而增强了融合过程的鲁棒性和可靠性,“研究人员解释说。

在评估动态点-像素特征对齐网络时,研究团队将人工多模态噪声引入KITTI数据集。根据研究结果,所提出的网络是最先进、最准确的3D目标检测方法之一。

免责声明: 激光网遵守行业规则,本站所转载的稿件都标注作者和来源。 激光网原创文章,请转载时务必注明文章作者和来源“激光网”, 不尊重本站原创的行为将受到激光网的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:133 467 34 45@qq.com