激光网
当前位置: 首页 > 人工智能 > 正文

Meta发布音乐生成AI MusicGen 可使用文字改编现有曲目

2023-06-13 16:56:06  来源:激光网原创    

  目前针对生成式 AI 已经展现出积极企图的 Meta AI 团队,也没有错过音乐生成方面的技术进展。 宣布由他们的 Audiocraft 研究团队所打造的 AI 音乐生成服务深度学习语言模型 MusicGen。 继续阅读Meta发布音乐生成AI MusicGen:能创作音乐,也能用「文字」改编现有曲目报导内文。

  除了能跟涂鸦人物一起跳舞的 Animated Drawings,目前针对生成式 AI 已经展现出积极企图的 Meta AI 团队 ,也没有错过音乐生成方面的技术进展。 宣布由他们的 Audiocraft 研究团队所打造的 AI 音乐生成服务深度学习语言模型 MusicGen,已经在 github 开源可通过自己的 GPU 硬件或以 Google Colab 来完整生成音乐(这里有 Facebook Research 的步骤)。 还能在线上提供 MusicGen 通过提示词文字来「改编」现有曲目的功能 - 可以点此试用。 将可上传音乐片段来产生一段约 12 秒的生成式音乐内容。

  线上版的 MusicGen 使用起来非常简单。 笔者上传近4分钟的旋律音乐。 透过基本的提示词来以 MusicGen 生成的话,将会需要约 200 多秒的时间来处理; 透过相对复杂的示范提示词如「An 80s driving pop song with heavy drums and synth pads in the background」来生成则是会长上更多。

  就改编的效果来说,个人觉得还算蛮有意思的 - 也蛮想知道从文字完全创作一首 AI 音乐的效果会是如何。 Meta AI 的员工也有在 Twitter 释出了 MusicGen 的音乐改编效果(如上)。

  官方也自信地提到,他们与现有的其他服务包括 MusicLM、Riffusion 与 Musai 相比较,MusicGen 皆能产出更好的结果。 这点可能与研究团队提到,MusicGen采用与其他技术不同,是以无需自我监测语义表现,并且每秒可提供50个自我回归的音频处理步骤。 因此可以达到更优异的生成效果表现的关键?

  是说,既然 Adobe 最近针对自家图片生成服务提供了完全不用担心版权问题的 Firefly 企业版的选择。 大家应该也会好奇 Meta MusicGen 的学习来源是啥?

  Meta表示 MusicGen 产生的音乐可作为商业用途,就官方的说法是他们总共使用了 1 万小时的高品质音乐的内部资料集,及 2 万小时包括 Shutterstock 与 Pond5 的授权音乐以 Meta 的 32Khz 音乐编码器的 tokenizer 标记器进行训练。

  嗯,总觉得商用方面也许都有透过授权来进行训练的话,生成完整全新创作的曲子感觉应该是没问题。 不过目前能直接线上玩到的改编部分,就不知道是否完全没问题了。 所以还是建议大家线上玩归玩,如果真的要商业使用的话还是要先研究一下是否会有侵权的问题再说唷。

免责声明: 激光网遵守行业规则,本站所转载的稿件都标注作者和来源。 激光网原创文章,请转载时务必注明文章作者和来源“激光网”, 不尊重本站原创的行为将受到激光网的追责,转载稿件或作者投稿可能会经编辑修改或者补充, 如有异议可投诉至:Email:133 467 34 45@qq.com