激光网
当前位置: 首页 > 软件 > 正文

谷歌确认将公共数据用于其人工智能服务

2023-07-10 11:19:07  来源:激光网原创    

  这是人工智能机器人最不为人知的秘密:为了训练他们的语言模型,出版商利用了最多的数据,这些数据的来源非常多样化。谷歌已经证实,巴德是从互联网上获取的公共信息中“训练”出来的。

  该公司补充说,它可以“使用公开信息来帮助训练谷歌的人工智能模型,并构建谷歌翻译、巴德和云人工智能功能等产品和功能。谷歌发言人告诉The Verge,“我们的隐私政策一直对谷歌使用开放网络上的公开信息来训练语言模型保持透明。

  最新的更新“只是澄清了像巴德这样的新服务也包括在内。我们根据我们的人工智能原则,将隐私原则和保障措施纳入我们的人工智能技术开发中。更新后的服务条款规定,“公开信息”用于训练谷歌的人工智能产品,但他们没有说明公司将如何阻止受版权保护的内容被纳入此数据池。

  许多可公开访问的网站都有政策禁止为训练庞大的语言模型和其他人工智能工具而收集数据或进行网络抓取。这些禁令将如何一方面与谷歌的做法相适应,另一方面又如何适应GDPR等各种全球法规?这些保护个人在未经明确许可的情况下不被滥用其数据。

  聊天机器人行业的竞争加剧,以及这些新法律,使得流行的生成智能系统的制造商,如OpenAI的GPT-4,对用于训练这些模型的数据的来源非常谨慎。

免责声明: 激光网遵守行业规则,本站所转载的稿件都标注作者和来源。 激光网原创文章,请转载时务必注明文章作者和来源“激光网”, 不尊重本站原创的行为将受到激光网的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:133 467 34 45@qq.com