Google Gemini推出Lyria 3音乐生成，让30秒自定义曲目成为可能

背景与意义

2026年2月18日，Google DeepMind在Gemini应用中正式推出最新生成式音乐模型Lyria 3。自2023年首代Lyria面世以来，Google一直致力于将音乐创作从专业工作站搬到普通用户的指尖。此次发布的Beta版让30秒内即可得到完整的音轨和封面，标志着生成式AI从文字、图像向声波的跨模态扩展进入成熟期，也为短视频平台、社交媒体提供了全新的配乐方式。

Lyria 3核心功能

无需自行撰写歌词：模型根据用户的文字提示自动生成对应歌词。
细粒度创意控制：支持指定曲风、声乐风格、节奏和配器等多维度参数。
提升音质与复杂度：采用更深层的Transformer和多模态注意力机制，生成的音轨在和声、编曲和乐器表现上更接近专业制作。
即时封面生成：配套的Nano Banana模型会为每段音频生成独一无二的封面艺术。

使用方式与示例

文字生成：在Gemini对话框输入“为我创作一段充满非洲节奏的欢乐Afrobeat，歌词围绕童年记忆”。几秒钟后即可收到带歌词的30秒音频及封面。
图像驱动：上传一张狗狗在森林徒步的照片，系统会解析场景情绪，输出一段配合画面氛围的民谣式配乐。

“我只需要描述情绪，Gemini就把它变成音乐，这种创作自由感前所未有。”——Gemini产品经理 Joël Yawili

内容安全与版权保障

Lyria 3所有生成的音频都嵌入了SynthID不可感知水印，用户可在应用内通过“检测音频是否为AI生成”功能验证真伪。Google在模型训练阶段与音乐社区合作，加入了版权过滤和艺术家风格抑制机制，确保输出不直接复制已有作品。若发现侵权内容，平台提供快速举报通道并承诺及时处理。

市场展望与竞争格局

用户覆盖：目前Beta仅面向美国用户，支持英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语，计划在数周内扩展至全球。
商业化路径：Google AI Plus、Pro、Ultra订阅用户将拥有更高的生成配额和高级音频编辑工具。
竞争对手：Meta的AudioGen、OpenAI的Jukebox等均在探索类似场景，Lyria 3凭借跨模态输入与SynthID安全体系，在内容创作与合规之间取得平衡。

随着短视频和社交平台对个性化配乐需求的激增，Lyria 3有望成为创作者的默认配乐工具，也为AI生成内容监管提供了可复制的技术范式。

如欲体验，请访问 gemini.google.com 并登录Gemini应用，即可开始30秒音乐创作之旅。

Google Gemini推出Lyria 3音乐生成，让30秒自定义曲目成为可能