Google发布Nano Banana 2 Lite与Gemini Omni Flash 加速多模态生成

新模型概览

Google DeepMind 今日正式向开发者开放两款全新生成式模型。Nano Banana 2 Lite 主打文本到图像的超低延迟与成本效益；Gemini Omni Flash 则融合 Gemini 的多模态推理能力，实现高质量的视频生成与对话式编辑。两者均已在 Google AI Studio、Gemini API 以及 Gemini Enterprise Agent Platform 上线，并同步进入 Search AI Mode、Gemini App 等消费端产品。

Nano Banana 2 Lite

响应速度：单张 1K 分辨率图像平均生成时长约 4 秒，适合交互式原型和实时视觉草图。
成本优势：计费 $0.034/千像素，较同类商用模型下降约 30%。
质量保持：在保持快速的同时，仍能实现较高的 Prompt 服从度、字符一致性以及图内文字可读性。
适配场景：快速创意迭代、海量图像批量生成、低带宽环境下的实时预览。

Gemini Omni Flash

视频时长：当前支持最长 10 秒的视频生成，单秒计费 $0.10，定价与 Veo 3.1 Fast 持平。
对话式编辑：用户可通过自然语言对已有视频进行剪辑、特效添加等操作。
多模态输入：支持文本、图像和短视频（≤3 秒）混合提示，实现跨模态内容的统一控制。
知识融合：模型内置 Gemini 的事实库，可在视频中自动加入历史、科学或叙事逻辑。
局限性：音频上传、长时段视频、以及跨场景人物一致性仍在研发中。

开发者使用场景

Anywhere Demo：用户上传自拍，Nano Banana 2 Lite 生成全球地标背景图，点击后 Gemini Omni Flash 将图像转为动画短片。
Space Lift：室内设计应用，先用 Nano Banana 2 Lite 生成多套装修方案，再通过 Omni Flash 生成 10 秒的沉浸式展示视频。
Omni Product Studio：电商场景下，将商品图片即时转化为带动态特效的宣传片，提升转化率。

这些示例展示了两模型的“图‑视频‑编辑”闭环，可通过 Gemini Interactions API 保存会话上下文，实现最多三轮的连续编辑。

安全与合规

Google 在模型输出中嵌入 SynthID 水印，用户可在 Gemini App、Chrome 或 Search 中核验内容来源；同时提供完整的 API 文档与使用指南，帮助开发者遵守版权与数据治理要求。

市场影响与前景

Nano Banana 2 Lite 的成本与时延优势有望在创意生成、广告素材批量生产等高频场景抢占市场份额；Gemini Omni Flash 则为视频内容创作打开了对话式、低门槛的入口，可能加速生成式视频在社交媒体和电商中的落地。随着后续对音频和更长时长的支持，二者的组合有望成为跨媒体创作的标准工具链。

“我们希望通过更快、更便宜的模型，让每位开发者都能把创意从概念快速落地。”——Google DeepMind 产品经理 Alisa Fortin

立即体验：前往 Google AI Studio 试用 Nano Banana 2 Lite 与 Gemini Omni Flash，或查阅官方 API 文档获取集成细节。