Llama 2-来自Meta的新一代大型语言模型,是与Microsoft合作创建的
RT-2是一种VLA模型,可以从在线资源和机器人数据中学习。它基于RT-1训练基地和VLM模型,如PaLM-E和PaLI-X。所有这些组件的组合使您可以获得非常好的结果。该模型可以使用通过放置在机器人中的摄像头可见的图像,并将这些数据转换为特殊令牌。如前所述,由于它的数据库基于来自互联网和机器人的数据,它能够解释对象并执行相关操作 - 即使他以前没有机会熟悉给定的元素。
Aurora genAI-英特尔提供了一个包含一万亿个参数的人工智能模型。科学的发展是开放的
因此,您可以向机器人发出命令,抓取一个物体并将其移动到另一个地方。在分析环境并找到物体后,输入数据将被处理成机器人可以理解的语言。这允许广泛的可能应用,因为模型学习图像和语言之间的相关性。RT-2在精度方面的表现比其竞争对手要好得多,在模拟方面显示出90%的效率 - BC-Z,RT-1,LAWA。该公司还实施了思维链技术,由于长期规划,可以更有效地解决任务。本新闻中的最后一个图形完美地说明了这一点,您可以在其中看到机器人如何要求选择驱动钉子所需的有用物体,选择一块石头而不是一张纸和一根电线。VLA模型肯定会为机器人技术的发展做出重大贡献。