激光网
当前位置: 首页 > 软件 > 正文

微软推出Fabric 为新平台添加Copilot

2023-11-16 16:30:34  来源:激光网原创    

  微软周三推出了 Fabric,这是一个新的人工智能分析和数据管理平台,于 5 月首次推出预览版。

  Fabric现已正式发布,是一个SaaS平台,汇集了微软长期商业智能套件Power BI的功能;数据工厂;和 Azure Synapse Analytics。

  在首次推出Fabric时,微软董事长兼首席执行官萨蒂亚·纳德拉称该产品组合是自1989年SQL Server以来科技巨头最重要的新数据产品。

  Ventana Research的分析师David Menninger对此表示赞同。

  “如果最大的是通过产品的广度和深度来衡量的,那么你必须同意这是自SQL Server以来微软最大的数据产品,”他说。

  微软在西雅图举行的用户大会 Ignite 上透露了 Fabric 的普遍可用性,该供应商在会上推出了数十种新的、主要是人工智能支持的更新、功能和产品。

  在广泛引入传统和基于生成式人工智能技术的功能之际,生成式人工智能技术在企业软件的所有领域都呈爆炸式增长。在过去的一年里,科技巨头和独立供应商迅速采取行动,开发基于人工智能的生成式系统并将其推向市场。

  除了向所有客户提供Fabric之外,微软还推出了Copilot in Fabric的预览版。自然语言处理工具使用户能够使用对话语言查询其数据并生成代码。

  除了 Fabric 之外,我还引入了一系列其他新的和改进的分析和数据管理功能,包括新的数据库功能,例如 Azure Cosmos DB MongoDB vCore 中的矢量搜索。

  新面料

  Microsoft Fabric 是一个用于数据集成、数据管理和分析的新环境,汇集了一组功能,使客户能够以多种方式对数据进行建模和分析。

  该套件包括 Power BI,这是微软长期以来的传统 BI 平台,用户可以在其上开发和使用数据产品,例如报表、仪表板以及人工智能和机器学习模型。此外,Fabric 还包括 Azure Synapse Analytics,这是一种基于云的服务,用于数据集成、数据仓库和大数据分析。最后,Fabric 包括 Azure 数据工厂,这是一种提取、转换和加载服务,使客户能够大规模集成和转换数据。

  除了三个以前独立的平台外,Fabric 还包括一个名为 OneLake 的多云数据湖,可自动连接到 Fabric 中的每个数据工作负载。OneLake 附带了 Azure Data Lake Storage Gen2 和 Amazon S3 等数据源的快捷方式。

  根据微软的说法,将以前不同的平台组合在一个环境中旨在简化数据管理和分析。

  同时,随着组织以越来越复杂的形式收集越来越多的数据,简单性尤为重要,所有这些数据都需要结合起来,为组织想要构建的生成式人工智能语言模型提供信息和训练,以改善决策。

  因此,随着人工智能变得越来越普遍,BI超越了数据可视化,转向模型训练和分析,微软公司通信副总裁Frank Shaw表示,Fabric的开发是为了满足组织的需求。

  他在 11 月 10 日的虚拟新闻发布会上表示:“Microsoft Fabric 通过将所有人聚集在一个专为人工智能时代构建的人工智能驱动的平台上,重塑了团队处理数据的方式。“它创造了一种集成、简化的体验,将您的数据状态统一到企业级数据基础上。”

  Fabric 中包含的数据集成、管理和分析功能经常被许多组织拼凑在一起。他们可能会使用来自一个供应商的数据摄取和集成平台、来自另一个供应商的存储和管理工具,以及顶部的各种 BI 平台来进行实际分析和决策。

  这种方法可帮助组织避免供应商锁定,使他们摆脱对所有数据管理和分析工具依赖一家供应商的束缚。

  但是,供应商中立的方法既有财务成本——将不同供应商的工具放在一起通常比只从一家供应商那里购买更昂贵——而且复杂性也随之而来。组织本身必须将最初未开发为相互集成的工具连接起来,而不是购买旨在相互集成的工具。

  因此,根据微软的说法,成本是Fabric的主要优势之一。

  Fabric 的定价基于使用情况,两个单位的起价为每小时 36 美分或每月 262.80 美元,2,048 个单位的价格为每小时 368.64 美元或每月 269,107.20 美元。

  与此同时,Menninger认为,简单性可能是Fabric的最大优势。

  “大多数功能都不是新的,但它们都汇集到一个统一的平台中,”他说。“用户应该发现在Fabric的上下文中将所有这些功能结合起来更容易,而不必将东西拼接在一起来创建自己的结构 - 双关语。

  除了成本和简单性之外,Fabric 中最重要的功能可能是 OneLake 和 S3 等数据源的快捷方式,Menninger 继续说道。

  “通过实现跨应用程序的数据共享,这些功能将有助于减少冗余数据以及随之而来的所有麻烦,包括额外的数据管道、数据同步问题和数据治理挑战,”他说。

  结构和 AI

  虽然Fabric旨在为Microsoft客户提供开发和管理现代数据产品(包括AI和机器学习模型)所需的工具,但该平台也受益于AI。

  像许多Microsoft功能一样,Fabric将获得一个专用的Copilot。

  Copilots 由 Microsoft 于 2021 年首次推出,是 NLP 工具,可协助用户完成工作。这家科技巨头的第一个Copilot是为微软和软件开发平台GitHub的联合用户开发的。从那时起,Microsoft发布了Office 365,Teams和许多其他工具的Copilots。

  Fabric 中的 Copilot 现已推出公共预览版,使客户能够使用自然语言而不是代码广泛地处理其数据。

  近年来,许多数据管理和分析平台都具有 NLP 功能。但这些 NLP 功能是有限的。他们接受的训练词汇量有限,这意味着使用这些工具仍然需要数据素养培训,而且它们不能用于建模和深入分析。

  自从人工智能供应商OpenAI发布ChatGPT以来,这种情况发生了变化,OpenAI是Microsoft的合作伙伴,这家科技巨头已经投资了130亿美元。大型语言模型标志着生成式人工智能和法学硕士技术的重大改进。ChatGPT和其他LLM,包括Google Bard和Microsoft的Azure OpenAI,拥有广泛的词汇表,可以实现自由形式的自然语言交互。

  通过将这些 LLM 功能与他们自己的工具集成,数据管理和分析供应商现在能够开发 NLP 功能,让客户可以像在谷歌中进行搜索和提问一样提出数据问题。此外,他们无需编写代码即可开发流程和管道。

  Copilots是微软支持自然语言交互的工具版本。

  就Fabric而言,Copilot将使用户能够使用对话语言来生成代码,开发数据管道,并创建AI和机器学习模型以及其他数据产品。

  与此同时,Menninger指出,在以前需要代码知识和数据素养培训的任务中使用自然语言应该使组织内更多的员工能够处理数据。

  二十多年来,组织内的BI使用一直停滞不前,大约四分之一到三分之一的员工。会话语言可以改变这一点。

  “Copilot是Microsoft将生成式AI封装到其产品中,”Menninger说。“生成式人工智能的真正直接价值是NLP。NLP可用于使数据和分析的许多方面更易于使用,这也具有使组织内的数据和分析更容易访问的副作用。

  Shaw表示,Copilot还将帮助数据专家提高效率。

  虽然生成式 AI 驱动的自然语言使组织内的更多人能够使用数据和分析,但它也消除了数据工程师和数据科学家编写开发管道和创建模型所需的大量代码所需的大量时间。

  “借助 Microsoft Fabric 中的 Copilot,数据专业人员可以使用对话语言快速发现新的见解,并在这个 AI 新时代更好地快速竞争,”Shaw 说。

  自 ChatGPT 发布以来的一年里,除了 Microsoft 之外,许多数据管理和分析供应商都发布了 AI 助手和文本到代码的翻译功能。

  例如,Microsoft竞争对手AWS和谷歌都在其数据管理和分析产品组合中增加了生成式AI功能,许多集中的数据管理和分析供应商也是如此。

  更多新功能

  虽然Fabric的全面发布可能是Microsoft最重要的新数据产品,但这家科技巨头周三还透露了许多其他新功能和更新功能。

  其中包括 Azure Cosmos DB MongoDB vCore 中的矢量搜索。

  Azure Cosmos DB MongoDB vCore 是微软与数据库专家 MongoDB 之间的集成,使共同客户能够开发数据应用程序。

  与此同时,在生成式人工智能发展的激增中,矢量搜索是一项越来越重要的功能。向量是数据的标识符,它提供了数据结构,因此可以在其他数据的泥潭中搜索和找到数据,并随后用于为决策提供信息。

  有些数据从一开始就是结构化的,例如财务记录和销售点交易。但文本、照片和视频文件等数据是非结构化的。

  同时,生成式 AI 模型比其他模型类型需要更多的数据来确保高水平的准确性。这意味着组织通常需要将结构化数据与非结构化数据相结合,以便为这些生成式 AI 模型提供足够的数据。

  因此,非结构化数据通常被分配一个向量以赋予其结构,然后使其能够被发现并用于为模型提供信息。

  此外,构建矢量数据库是为了进行相似性搜索,以便其他方式无法发现的数据也可用于训练模型。

  除了 Azure Cosmos DB MongoDB vCore 中的矢量搜索之外,新的和更新的数据管理和分析功能还包括:

  Amazon S3 快捷方式,使组织能够将其在 Amazon S3 中的数据与 Microsoft OneLake 中的数据统一起来,而无需复制数据。

  使数据工程师能够将数据从外部 Azure Data Lake Storage Gen2 数据湖连接到 OneLake 的快捷方式。

  Azure SQL 更新可降低成本并提高可靠性和安全性。

  Microsoft 365和OneLake之间的集成。

  Azure Cosmos DB 中的新功能可降低成本并提高开发人员的工作效率。

  提高了 SQL Server 的安全性。

  Azure 数据库中的性能增强功能。

  Azure Database for PostgreSQL 的新人工智能功能和性能改进。

  Menninger指出,许多新的和改进的功能,例如亚马逊的S3快捷方式,表明微软承认客户使用来自多个供应商的工具。

  展望未来,微软明智的做法是做更多的事情,通过将微软工具连接到其他供应商的工具,使用户能够开发数据生态系统。

  “虽然Fabric的大部分功能都是关于统一微软产品和服务,但微软可以通过进一步扩展Fabric来为客户提供更多帮助,”Menninger说。“让我们看看他们在拥抱第三方数据源方面走了多远。

  埃里克·阿维登是TechTarget Editory的高级新闻撰稿人,也是一位拥有超过25年经验的记者。他负责分析和数据管理。

免责声明: 激光网遵守行业规则,本站所转载的稿件都标注作者和来源。 激光网原创文章,请转载时务必注明文章作者和来源“激光网”, 不尊重本站原创的行为将受到激光网的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:133 467 34 45@qq.com