激光网
当前位置: 首页 > 人工智能 > 正文

微软推出矢量搜索预览版,语音克隆正式发布

2023-07-19 15:12:43  来源:激光网原创    

  在其年度Inspire大会上,微软宣布了许多新的AI功能将进入Azure,其中最引人注目的可能是矢量搜索。矢量搜索通过 Azure 认知搜索提供预览版,它使用机器学习来捕获非结构化数据的含义和上下文,从而加快搜索速度。

  矢量化是搜索中越来越流行的技术,它涉及将单词或图像转换为矢量或一系列数字,对它们的含义进行编码 - 允许它们进行数学处理。向量使机器能够构建和理解数据,使它们能够理解,例如,在“向量空间”中靠近的单词 - 如“国王”和“女王” - 是相关的,并迅速从数百万个单词的数据库中显示它们。

  像Qdrant和SeMI Technologies这样的公司使用矢量搜索来支持他们的数据库服务,亚马逊和谷歌等科技巨头也是如此。

  微软的矢量搜索风格提供了“纯”矢量搜索、混合检索和“复杂”的重新排序。该公司指出,它可以用于应用程序和服务,以自然语言生成个性化响应,提供产品推荐并识别数据模式。

  “矢量搜索与Azure AI集成,允许客户构建支持搜索,基于聊天的应用程序,使用Azure AI Vision将图像转换为矢量表示形式,并从大型数据集中检索相关信息,以帮助自动化流程和工作流,”该公司在一篇博客文章中写道。 “矢量搜索的集成无缝扩展到Azure认知搜索的其他功能, 包括分面导航、过滤器等。

  在Azure的其他地方,微软正在推出所谓的文档生成AI解决方案,该解决方案将微软现有的AI驱动的文档处理服务与Azure OpenAI服务集成在一起。回想一下,Azure OpenAI 服务是 微软完全托管、以企业为中心的产品,旨在让企业能够访问 OpenAI 的 AI 技术,并增加了控制和治理功能。

  文档生成 AI 解决方案利用 OpenAI 最新的 AI 语言模型,为报告摘要、值提取、知识挖掘和生成新类型的文档等任务摄取文件。它本质上允许公司构建像OpenAI的ChatGPT这样的应用程序,该应用程序可以读取文档并将这些文档用作其响应的基础。

  例如,使用文档生成 AI,客户可以上传发票、账单和合同,以允许员工询问有关服务保证和特定行项目的问题。文档生成 AI 解决方案以文本、图像和表格的形式回答问题,为引文提供指向源内容的链接。

  微软解释道:

  “[使用文档生成 AI 解决方案,您可以] 使用自然语言与文档交互,并从现有文档中生成新内容,包括博客文章、新闻通讯、摘要和标题......无论您需要智能文档聊天功能、写作帮助、查询支持、全面的搜索功能,还是文档翻译,文档生成 AI 都可以通过 OpenAI 的模型处理复杂多样的文档任务。

  在一份相关的公告中,微软透露,OpenAI的Whisper模型是一种自动语音识别模型,将很快出现在Azure OpenAI服务以及微软的AI语音服务系列中。微软说,企业客户将能够使用Whisper转录和翻译音频内容,以及“大规模”生成批量转录。

  在Inspire的AI发布会上,微软宣布了实时Diarization的公共预览版,这是一种AI驱动的语音服务,可以识别几个人中的哪一个在实时说话。该公司还宣布更广泛地推出自定义神经语音,该语音利用人工智能来密切再现演员的声音或创建原始合成语音。

  以前,自定义神经语音的访问权限较为有限。客户仍然必须申请并获得微软的批准才能使用它。

  为了避免人们担心深度伪造的潜力,微软说自定义神经语音包括有助于防止滥用该服务的控件。当客户提交录音时,配音演员必须发表声明,承认他们了解这项技术并知道客户正在配音。然后通过扬声器验证比较录音,以确保在客户开始创建语音之前声音匹配。

  微软合同上还要求客户获得配音员的同意,并且客户必须同意行为准则,然后才能开始使用自定义神经语音。此外,微软还提供水印和检测工具,旨在更轻松地识别给定音频剪辑是否是使用自定义神经语音创建的。

  这些控制,假设它们像宣传的那样工作,不一定能解决围绕语音克隆技术的许可和同意争议。但微软显然已经决定,这不是它的战斗。

免责声明: 激光网遵守行业规则,本站所转载的稿件都标注作者和来源。 激光网原创文章,请转载时务必注明文章作者和来源“激光网”, 不尊重本站原创的行为将受到激光网的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:133 467 34 45@qq.com