谷歌 Deepmind 推出 Lyria AI 音频模型,可生成带有乐器和人声的音乐
创始人
2025-07-07 01:21:16
0

11 月 21 日消息,Deepmind 日前推出了一款名为 Lyria 的音频模型,可用于生成带有乐器和人声的音乐。此外 Deepmind 还通过与 YouTube 合作,整合 Lyria 模型开发了音乐创作工具 Dream Track,声称可令视频创作者“更有效率地将想法变为作品”。

研究人员介绍了当前通过 AI 模型生成音乐的挑战,这是因为音乐本身包含极高的信息密度,其中每一秒钟都可能拥有多个节拍、音符及和声。而这也使得“生成音乐”相较于“生成语言(文字转语音)”更为复杂,而对于 AI  模型来说,维持长音乐序列中的连续性也更为困难,这是因为模型需要在不同的乐句、诗节和长段落中,保持音乐的流畅性和一致性。

此外,由于音乐片段中经常同时包含多个声部和乐器,这也进一步增加了音乐生成的难度,相关音频模型必须能够协调多种声音和旋律,从而使生成的音乐更自然。

而 Deepmind 所开发的 Lyria AI 模型,便是针对上述痛点进行的尝试,这款模型的最大特点就是能够生成包含乐器和人声的高品质音乐。

▲ 图源 Deepmind▲ 图源 Deepmind

此外,Lyria 模型还擅长进行音乐变换和延续的任务,因此模型还能基于现有音乐片段生成出风格新颖或统一的后续片段。

研究人员同时强调,Lyria 模型拥有细致的微调选项,可让用户精确生成音乐风格及表现方式,因此这款模型可以“满足专业音乐创作的需求,同时也可以让业余用户轻松上手”。

▲ 图源 Deepmind▲ 图源 Deepmind

IT之家注意到,目前 YouTube 已经在短视频功能“Shorts”中应用 Lyria 模型,相关成果已经集成在 YouTube 的实验音乐创作工具 Dream Track 中,用户可以用这款工具生成多样化的配乐,并可选用 Charlie Puth、Charli XCX、Sia 等艺术家的音乐风格来创造出“全新演绎”。

▲ 图源 Deepmind▲ 图源 Deepmind

据悉,用户可以在 Dream Track 中简单地输入主题,之后即可选择一位艺术家,为短视频生成 30 秒的配乐、歌词、伴奏等内容。

▲ 图源 Deepmind▲ 图源 Deepmind

▲ 图源 Deepmind▲ 图源 Deepmind

此外,Deepmind 还表示,研究人员正广泛地探索 AI 在音乐创作领域的应用,未来用户只需要哼唱,AI 就会把旋律配成带有歌词的完整歌曲,也可以将古早的 MIDI 音乐转换为 Remix 版本,或为音轨添加各种乐器伴奏。

Deepmind 同时提到,Lyria 模型生成的所有内容,都会加上 SynthID 水印标记。这是一种辨识歌曲是否是由 AI 生成的水印机制,号称能够在不影响听觉体验的前提下,为 AI 生成的音乐嵌入“听众无法察觉的水印标记”。

▲ 图源 Deepmind▲ 图源 Deepmind

研究人员提到,带有“声音水印”的音频,即便添加噪音,或是进行 MP3 压缩,甚至对变更音调速度,也都能够维持可检测性,而 Lyria 模型也可以通过检测歌曲中的 SynthID,来确认歌曲中由 Lyria 模型生成的部分,从而更容易辨别音乐主题内容,方便生成后续音乐片段。

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...
《非诚勿扰》红人闫凤娇被曝厕所... 【51CTO.com 综合消息360安全专家提醒说,“闫凤娇”、“非诚勿扰”已经被黑客盯上成为了“木...
2012年第四季度互联网状况报... [[71653]]  北京时间4月25日消息,据国外媒体报道,全球知名的云平台公司Akamai Te...