Google将街景引入Genie模型,开启真实街道模拟新篇章

35 阅读3分钟前沿
Google将街景引入Genie模型,开启真实街道模拟新篇章

背景介绍

在今年 I/O 开发者大会上,Google DeepMind 公开了 Project Genie 与 Street View 的深度融合。Genie 是 Google 最新的通用世界模型,已在去年 8 月推出 Genie 3 研究预览,并于 1 月向美国的 Google AI Ultra 订阅用户开放。此次整合让模型能够基于全球 2800 亿张街景图像,生成可交互的三维环境。

功能亮点

  • 真实街道再现:利用 Street View 的全景影像,Genie 能在虚拟空间中重建具体街道的建筑、道路和植被。
  • 天气与季节切换:用户可自行调节光照、降雪、雨雾等气象条件,模拟“明日世界”或“灾后场景”。
  • 多视角代理:支持人类、机器人或车辆视角切换,实现 360° 空间连续性记忆。
  • 即时交互:通过自然语言指令创建或修改场景对象,如在街角放置障碍物或添加行人。

“Genie 能够把街景数据和生成式世界模型结合起来,这对机器人感知和仿真训练意义重大。”——Jack Parker‑Holder,DeepMind 开放式研究团队科学家

应用前景

  • 机器人训练:如伦敦部署的服务机器人,可在虚拟阳光下预演罕见光照条件,降低真实环境冲击。
  • 自动驾驶:Waymo 已在 Genie 上测试罕见天气与动物闯入等极端情景,提升跨城市部署的安全性。
  • 游戏与教育:开发者可以用文字或图片快速生成基于真实地标的游戏关卡,学生亦可通过沉浸式街景学习历史与地理。

限制与挑战

目前模型仍缺乏物理感知,生成的角色会穿透植被或建筑;画面质量更接近电子游戏而非光线追踪渲染。Google 表示,物理引擎的融合仍在实验阶段,预计 6–12 个月内实现更高逼真度。

行业影响

Street View 与 Genie 的结合标志着生成式 AI 从抽象场景向真实世界迁移的关键一步。它不仅为 Google 自家的地图、自动驾驶和云计算业务提供新数据入口,也可能催生第三方开发者围绕真实地理信息构建的创新应用。随着模型精度提升,AI 驱动的数字孪生有望在城市规划、灾害预演等领域发挥更大价值。

本文是对第三方新闻源的主观解读。消息可能出现过时、不准确、歧义或错误的地方,仅供参考使用。点击此处查看消息源。