Google发布Nano Banana 2 Lite与Gemini Omni Flash 加速多模态生成
•2 阅读•4分钟•前沿
Google文生视频Gemini Omni FlashNano Banana 2 Lite
•2 阅读•4分钟•前沿

新模型概览
Google DeepMind 今日正式向开发者开放两款全新生成式模型。Nano Banana 2 Lite 主打文本到图像的超低延迟与成本效益;Gemini Omni Flash 则融合 Gemini 的多模态推理能力,实现高质量的视频生成与对话式编辑。两者均已在 Google AI Studio、Gemini API 以及 Gemini Enterprise Agent Platform 上线,并同步进入 Search AI Mode、Gemini App 等消费端产品。
Nano Banana 2 Lite
- 响应速度:单张 1K 分辨率图像平均生成时长约 4 秒,适合交互式原型和实时视觉草图。
- 成本优势:计费 $0.034/千像素,较同类商用模型下降约 30%。
- 质量保持:在保持快速的同时,仍能实现较高的 Prompt 服从度、字符一致性以及图内文字可读性。
- 适配场景:快速创意迭代、海量图像批量生成、低带宽环境下的实时预览。
Gemini Omni Flash
- 视频时长:当前支持最长 10 秒的视频生成,单秒计费 $0.10,定价与 Veo 3.1 Fast 持平。
- 对话式编辑:用户可通过自然语言对已有视频进行剪辑、特效添加等操作。
- 多模态输入:支持文本、图像和短视频(≤3 秒)混合提示,实现跨模态内容的统一控制。
- 知识融合:模型内置 Gemini 的事实库,可在视频中自动加入历史、科学或叙事逻辑。
- 局限性:音频上传、长时段视频、以及跨场景人物一致性仍在研发中。
开发者使用场景
- Anywhere Demo:用户上传自拍,Nano Banana 2 Lite 生成全球地标背景图,点击后 Gemini Omni Flash 将图像转为动画短片。
- Space Lift:室内设计应用,先用 Nano Banana 2 Lite 生成多套装修方案,再通过 Omni Flash 生成 10 秒的沉浸式展示视频。
- Omni Product Studio:电商场景下,将商品图片即时转化为带动态特效的宣传片,提升转化率。
这些示例展示了两模型的“图‑视频‑编辑”闭环,可通过 Gemini Interactions API 保存会话上下文,实现最多三轮的连续编辑。
安全与合规
Google 在模型输出中嵌入 SynthID 水印,用户可在 Gemini App、Chrome 或 Search 中核验内容来源;同时提供完整的 API 文档与使用指南,帮助开发者遵守版权与数据治理要求。
市场影响与前景
Nano Banana 2 Lite 的成本与时延优势有望在创意生成、广告素材批量生产等高频场景抢占市场份额;Gemini Omni Flash 则为视频内容创作打开了对话式、低门槛的入口,可能加速生成式视频在社交媒体和电商中的落地。随着后续对音频和更长时长的支持,二者的组合有望成为跨媒体创作的标准工具链。
“我们希望通过更快、更便宜的模型,让每位开发者都能把创意从概念快速落地。”——Google DeepMind 产品经理 Alisa Fortin
立即体验:前往 Google AI Studio 试用 Nano Banana 2 Lite 与 Gemini Omni Flash,或查阅官方 API 文档获取集成细节。
本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。