Google为Gemini新增音乐生成功能,Lyria 3让AI创作歌曲成为可能
•34 阅读•3分钟•应用
GoogleGeminiLyria 3SynthIDDream Track
Ivan Mehta••34 阅读•3分钟•应用

功能亮点
- 文字、图片、视频即能生成音乐:用户只需描述想要的歌曲风格或上传媒体文件,Gemini即可输出30秒左右的完整曲目并配以封面艺术。
- 多语言支持:目前覆盖英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语,面向全球18+用户开放。
- 风格与参数可调:用户可自行设定歌曲的节奏、演唱方式、乐器编制等细节,实现更精准的创作意图。
- Dream Track全平台扩展:Google将同一模型同步提供给YouTube创作者,原本仅美国可用的Dream Track功能现已全球上线。
技术细节
Google采用DeepMind研发的 Lyria 3 音乐生成模型,该模型在音色真实度、和声复杂度以及歌词连贯性上均优于前代。为防止版权侵权,系统内置两层过滤:
- 艺术家风格限制:若提示中出现具体艺术家名称,模型仅参考其风格而不直接复制旋律。
- SynthID水印:所有生成的音频均嵌入不可见的SynthID标识,便于后续追溯与版权监管。
市场与监管背景
AI生成音乐正处于快速增长与争议并存的阶段。YouTube与Spotify等平台已与音乐版权方签署合作协议,尝试将AI创作曲目商业化;与此同时,多个音乐公司对训练数据的版权归属提起诉讼。Google在产品说明中强调,Lyria 3旨在“原创表达”,并配备AI生成内容检测工具,用户可上传音频让Gemini判断其是否为AI产出。
行业影响
- 创作者赋能:中小型内容创作者无需专业作曲背景即可快速产出配乐,降低视频制作成本。
- 版权治理新范式:SynthID与AI检测功能为监管机构提供技术手段,或推动行业制定统一的AI音乐标识标准。
- 竞争格局加剧:Google的跨平台布局将与OpenAI、Meta等在生成式音频领域的布局形成直接竞争,预计未来几个月会出现更多模型迭代与商业化实验。
“Music generation with Lyria 3 is designed for original expression, not for mimicking existing artists.” — Google 官方博客
随着生成式AI技术的不断成熟,音乐创作正从专业工作室向大众化工具转变。Google此次在Gemini中引入Lyria 3,标志着AI音乐进入消费级应用的关键里程碑,也为行业监管提出了更高的技术要求。
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。