微软正在努力证明人工智能中的“智能”部分,并且刚刚公布了其图灵布莱切利系列机器智能模型的最新版本图灵布莱切利v3。
正如官方博客文章所解释的那样,图灵布莱切利 v3 是一个多语言视觉语言基础模型,并将集成到许多现有的微软产品中。
如果这个模型的名字听起来很可怕,请不要担心 - 让我们分解一下。
“多语言”部分是不言自明的 - 该模型有助于微软产品在多种语言中更好地运行,目前已超过90种语言。
“视觉语言”部分意味着模型同时具有图像处理和语言功能,这就是为什么这种模型被称为“多模态”。
最后,“基础模型”部分是指实际模型的概念和技术结构。
该多模式模型的第一个版本于 2021 年 11 月推出,并于 2022 年开始测试最新版本 v3。
图灵布莱切利v3非常令人印象深刻,因为制作一个可以“理解”一种输入的模型已经是一项艰巨的任务。
此模型结合了文本和图像处理,对于必应,可以改进搜索结果。
整合神经网络图灵布莱切利v3模型利用了神经网络的概念,这是一种对模仿人脑的机器进行编程的方法。
这些神经网络允许它以以下方式建立连接,如微软本身所述:“给定图像和描述图像的标题,标题中的某些单词被掩盖。
然后训练神经网络来预测以图像和文本为条件的隐藏单词。
该任务也可以翻转以遮盖像素而不是文字。
模型以这种方式一遍又一遍地训练,与我们学习的方式没有什么不同。
该模型还受到微软开发人员的持续监控和改进。
新模型还在哪里使用必应搜索并不是唯一使用图灵布莱切利v3进行改进的产品。
它还用于Microsoft Xbox Live游戏服务中的内容审核。
该模型可帮助 Xbox 审查团队识别 Xbox 用户上传到其档案的不当和有害内容。
内容审核是一项艰巨的工作,而且经常让人精神疲惫,因此任何帮助版主实际上必须看到不那么令人不安的内容的帮助在我看来都是一个巨大的胜利。
我可以看到图灵布莱切利 v3 以类似的方式部署在 Bing 搜索的内容审核中。
这听起来像是必应搜索的重大改进。
人工智能辅助的热度正在上升,尤其是在微软和谷歌之间。
最近,确认将Bing AI带到了谷歌浏览器,现在它正在用于图像搜索。
我不认为谷歌不以最直接的方式将其视为直接竞争。
谷歌在浏览器和搜索量方面仍然享有最大的人气,但没有什么是一成不变的。