人工智能竞赛持续升温,作为科技巨头的谷歌自然积极布局,努力开新产品和工具。 谷歌近日宣布,推出全新针对机械人打造的人工智能模型「Robotic Transformer 2」,新AI模型主要运用网上数据训练机械人,其执行效率比上一代模型提高为62%。
谷歌表示,RT-2主要以来自网络的文字与图像数据进行训练,再结合上一代Robotic Transformer 1机械人的训练资料,透过理解文字及视觉,让机械人可更容易执行人类所要求的任务。
Google DeepMind科学家Vincent Vanhoucke表示,过去的机械人都是透过一个口号一个动作,想像人类想执行一件事时,就会拆解每一个动作并指使身体移动。 但RT-2可理解复杂的推理,还能直接输出动作。 只要输入少量的训练数据,就能转成直接的机械人行动。
举例指,过往如要训练机械人自动将喝完的可乐罐掉到垃圾桶,就必须先让机械人知道什么是可乐罐,并需要判断可乐是喝完了。 同时还需要训练机械人夹取可乐罐并放到垃圾桶。 但被输入大量网络资料的RT-2,已经能够分清楚何谓垃圾,而且就算未经特别训练,也能够懂得该把垃圾丢掉。 Vanhoucke补充,目前RT-2可以辨识香蕉皮与吃光的零食袋是垃圾。
谷歌表示,在有训练的情况下,RT-2成功率约90%; 而在未曾见过的背景、对象或环境的状态下,RT-2的执行效率到达62%,相比起上一代模型的32%,大幅上升。