当前位置：首页 > 人工智能 > 正文

阿里达摩院推出AI框架HQTrack 主要由视频多目标分割器和掩模优化器组成

2023-07-31 14:06:32　来源：IT之家　

　　阿里旗下达摩院日前与大连理工大学合作，推出了一款名为 HQTrack 的 AI 框架。该框架主要由视频多目标分割器(VMOS)和掩模优化器 (MR) 组成，旨在“实现对视频中任何目标的高质量跟踪”。

　　研究团队表示，HQTrack 基于开源框架 DeAOT、HQ-SAM，在此之上进行了一定改进，实现了“在视频中分割各目标”的可能性。

　　图源 HQTrack 的 GitHub 页面

　　同时，研究团队使用 Intern-T 作为特征提取器，提高框架对不同类型物体的区分能力，同时加入了一个门控传播模块(GPM)，以便于框架在复杂环境中感知更多微小物体，生成高质量的即时目标遮罩。

　　据悉，在 VOTS2023 竞赛中，HQTrack 以 0.615 的质量得分获得第二名，研究团队表示，该 AI 框架可以应用于人脸识别、智能驾驶、监控追踪等领域，并有望在未来商业应用中落地。

　　图源 HQTrack 的 GitHub 页面

　　该项目目前已经在 GitHub 中开放，感兴趣的小伙伴们可以在此访问，将 HQTrack 核心功能转录于下方：

　　1. 多目标追踪：HQTrack 可以同时追踪多个目标对象，适用于复杂场景下的目标追踪任务。

　　2. 目标分割：HQTrack 能够准确地分割视频中的目标对象，并生成高质量的目标遮罩，可用于目标识别和分析。

　　3. 高质量输出：HQTrack 的追踪结果具有高质量和高准确性，能够满足各种应用场景的需求。

　　4. 简单易用：HQTrack 提供了简洁的接口和使用指南，用户可以轻松地使用和集成该工具。

免责声明： 激光网遵守行业规则，本站所转载的稿件都标注作者和来源。激光网原创文章，请转载时务必注明文章作者和来源“激光网”，不尊重本站原创的行为将受到激光网的追责，转载稿件或作者投稿可能会经编辑修改或者补充，如有异议可投诉至：Email：133 467 34 45@qq.com

榜单