Google将街景引入Genie模型，开启真实街道模拟新篇章

背景介绍

在今年 I/O 开发者大会上，Google DeepMind 公开了 Project Genie 与 Street View 的深度融合。Genie 是 Google 最新的通用世界模型，已在去年 8 月推出 Genie 3 研究预览，并于 1 月向美国的 Google AI Ultra 订阅用户开放。此次整合让模型能够基于全球 2800 亿张街景图像，生成可交互的三维环境。

功能亮点

真实街道再现：利用 Street View 的全景影像，Genie 能在虚拟空间中重建具体街道的建筑、道路和植被。
天气与季节切换：用户可自行调节光照、降雪、雨雾等气象条件，模拟“明日世界”或“灾后场景”。
多视角代理：支持人类、机器人或车辆视角切换，实现 360° 空间连续性记忆。
即时交互：通过自然语言指令创建或修改场景对象，如在街角放置障碍物或添加行人。

“Genie 能够把街景数据和生成式世界模型结合起来，这对机器人感知和仿真训练意义重大。”——Jack Parker‑Holder，DeepMind 开放式研究团队科学家

应用前景

机器人训练：如伦敦部署的服务机器人，可在虚拟阳光下预演罕见光照条件，降低真实环境冲击。
自动驾驶：Waymo 已在 Genie 上测试罕见天气与动物闯入等极端情景，提升跨城市部署的安全性。
游戏与教育：开发者可以用文字或图片快速生成基于真实地标的游戏关卡，学生亦可通过沉浸式街景学习历史与地理。

限制与挑战

目前模型仍缺乏物理感知，生成的角色会穿透植被或建筑；画面质量更接近电子游戏而非光线追踪渲染。Google 表示，物理引擎的融合仍在实验阶段，预计 6–12 个月内实现更高逼真度。

行业影响

Street View 与 Genie 的结合标志着生成式 AI 从抽象场景向真实世界迁移的关键一步。它不仅为 Google 自家的地图、自动驾驶和云计算业务提供新数据入口，也可能催生第三方开发者围绕真实地理信息构建的创新应用。随着模型精度提升，AI 驱动的数字孪生有望在城市规划、灾害预演等领域发挥更大价值。