Google Gemini推出Lyria 3音乐生成,让30秒自定义曲目成为可能

38 阅读3分钟应用
Google Gemini推出Lyria 3音乐生成,让30秒自定义曲目成为可能

背景与意义

2026年2月18日,Google DeepMind在Gemini应用中正式推出最新生成式音乐模型Lyria 3。自2023年首代Lyria面世以来,Google一直致力于将音乐创作从专业工作站搬到普通用户的指尖。此次发布的Beta版让30秒内即可得到完整的音轨和封面,标志着生成式AI从文字、图像向声波的跨模态扩展进入成熟期,也为短视频平台、社交媒体提供了全新的配乐方式。

Lyria 3核心功能

  • 无需自行撰写歌词:模型根据用户的文字提示自动生成对应歌词。
  • 细粒度创意控制:支持指定曲风、声乐风格、节奏和配器等多维度参数。
  • 提升音质与复杂度:采用更深层的Transformer和多模态注意力机制,生成的音轨在和声、编曲和乐器表现上更接近专业制作。
  • 即时封面生成:配套的Nano Banana模型会为每段音频生成独一无二的封面艺术。

使用方式与示例

  1. 文字生成:在Gemini对话框输入“为我创作一段充满非洲节奏的欢乐Afrobeat,歌词围绕童年记忆”。几秒钟后即可收到带歌词的30秒音频及封面。
  2. 图像驱动:上传一张狗狗在森林徒步的照片,系统会解析场景情绪,输出一段配合画面氛围的民谣式配乐。

“我只需要描述情绪,Gemini就把它变成音乐,这种创作自由感前所未有。”——Gemini产品经理 Joël Yawili

内容安全与版权保障

Lyria 3所有生成的音频都嵌入了SynthID不可感知水印,用户可在应用内通过“检测音频是否为AI生成”功能验证真伪。Google在模型训练阶段与音乐社区合作,加入了版权过滤和艺术家风格抑制机制,确保输出不直接复制已有作品。若发现侵权内容,平台提供快速举报通道并承诺及时处理。

市场展望与竞争格局

  • 用户覆盖:目前Beta仅面向美国用户,支持英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语,计划在数周内扩展至全球。
  • 商业化路径:Google AI Plus、Pro、Ultra订阅用户将拥有更高的生成配额和高级音频编辑工具。
  • 竞争对手:Meta的AudioGen、OpenAI的Jukebox等均在探索类似场景,Lyria 3凭借跨模态输入与SynthID安全体系,在内容创作与合规之间取得平衡。

随着短视频和社交平台对个性化配乐需求的激增,Lyria 3有望成为创作者的默认配乐工具,也为AI生成内容监管提供了可复制的技术范式。


如欲体验,请访问 gemini.google.com 并登录Gemini应用,即可开始30秒音乐创作之旅。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。