谷歌给 Gemini 又加了火力。继文本、图片、视频之后,音乐也被装进来了——全新 AI 音乐生成模型 Lyria 3 已上线。

一句话就能生成一首完整歌曲:有词、有唱、有封面,约 30 秒成品。你甚至可以丢一张照片或一段视频给 Gemini,它会读懂画面情绪,自动“配一段 BGM”。比如一张猫咪在阳台打盹的照片,转眼就成了一支慵懒的小曲。
面向全球用户开放,现在就能用,且支持免费体验(有次数限制)。Gemini 月活 7.5 亿,这一手基本把 AI 作曲从“小众玩具”推到了“大众娱乐”。Suno、Udio 们压力要来了。
怎么玩:三种生成路径
网页版已经开用,移动端将于这几天陆续推送。
打开 Gemini,在工具菜单选择「Create music / 创作音乐」。

三种方式随你挑:
- 文字生成音乐:描述风格、情绪、场景或一段回忆,甚至是个笑话,Gemini 直接给你一首带歌词的完整歌。
- 图片/视频生成音乐:上传一张照片或一段视频,Gemini 会分析画面内容与情绪,自动填词谱曲。
- 模板与建议:没灵感就用谷歌提供的模板和动态建议,选中后稍作修改即可生成。
出品规格统一为约 30 秒音频;封面由 Nano Banana Pro 自动生成。

生成后可直接下载或分享链接。
额度说明:免费用户可用但次数有限;Google AI Plus、Pro、Ultra 付费层级享有更高额度。
Lyria 3 升级点:更聪明,也更“像真”
- 一体化创作:上一代还需要你手写歌词;现在只要给想法,歌词、旋律、人声一步到位。
- 可控参数:风格、人声、速度等都可调。
- 音质进化:生成音轨更真实、更复杂,整体听感更上一层楼。
不过谷歌给 Lyria 3 的定位很克制:它不是为了创作“传世名作”,更像给日常生活加一段有趣的自定义配乐。30 秒时长限制也印证了这一点。这并非专业音乐人的主力生产力工具,目标更是那 7.5 亿普通用户的创意表达。
YouTube 同步升级:Dream Track 开始全球推送
此前仅在美国开放的 Dream Track 功能,也开始面向全球推出。创作者可以为短视频一键生成专属配乐——可选带词或纯器乐,并可根据视频内容定制。
在海量短视频里,配乐就是创作者的“身份标识”。过去多依赖公共版权音乐库,如今可用 AI 生成完全原创的音轨。对自媒体创作者来说,值得一试。
版权与安全:避免“撞脸”,全程水印可溯源
AI 音乐版权问题早已不陌生。Suno、Udio 曾被三大唱片公司起诉,争议不断。谷歌的策略是将 Lyria 3 定位为“原创表达”,不模仿在世艺术家风格。
- 风格约束:提示词里即便包含某位歌手名字,也仅作为宽泛风格参考,而非直接模仿。
- SynthID 隐形水印:所有生成音轨都嵌入可追溯水印。你还可以把一段音频上传到 Gemini,询问“是不是 AI 生成”。此前 Gemini 已支持图片和视频的 AI 鉴别,现在音频也加入进来。
- 不宣称万无一失:谷歌承认水印识别并非完美,因此开放了举报通道。至于训练数据的合规难题,谷歌同样无法一笔带过。
语言与可用性
目前在 Gemini 中,Lyria 3 支持 8 种语言:英语、德语、西班牙语、法语、印地语、日语、韩语、葡萄牙语;暂不支持中文。谷歌表示后续会扩展更多语言。
一句话总结
文字、图片、视频、音频,谷歌正把所有 AI 能力收拢到同一个 Gemini App 里。现在就去 Gemini,在工具栏点「Create music」,开唱吧。