Google DeepMind推出Project Genie使用指南 四招助你快速构建交互式虚拟世界

项目概述
Google DeepMind近日在美国向 AI Ultra 订阅者推出实验性原型 Project Genie。该系统能够根据用户提供的文字描述或图片,实时生成可漫游的三维世界,并支持自定义角色进行交互式探索。虽然仍处于研究阶段,但已显露出生成式 AI 在虚拟内容创作和沉浸式体验方面的潜力。
四大提示助力世界构建
-
详尽描绘环境 先用文字勾勒出场景的整体氛围、天气、建筑或自然要素。例如 “雾气弥漫的北欧森林,地面覆盖厚厚的落叶,远处有古老的石桥”。细节越丰富,生成的世界越贴合预期。
-
精心挑选角色 角色是进入世界的入口,可设定外观、运动方式以及特效。可以是 “会喷火的机械龙”,也可以是 “背着小背包的像素小人”。角色的动作描述(飞行、滚动、倒退)会直接影响导航效果。
-
利用自定义图片 上传包含核心元素的图片,系统会以此为基础生成环境。确保角色位于画面中心且背景足够宽阔,以便 AI 正确识别并延伸场景。此方式适合想要快速复刻真实照片或概念艺术的用户。
-
使用简洁、动作导向的指令 短句式的直接指令最易被模型理解,如 “在星际废墟中漫步”,配合角色 “穿着太空服的探险者”。可在 Gemini 应用中获取提示优化建议,实时预览并微调。
视角切换提升沉浸感
Project Genie 支持第一人称视角和俯视第三人称视角两种模式。用户可通过界面右上角的视角按钮自由切换,体验从角色眼睛看到的细节或全景俯瞰的布局。不同视角在探索谜题或展示作品时都有独特价值。
未来展望
目前仅对美国 18 岁以上的 AI Ultra 订阅者开放,Google 表示将在后续逐步扩大覆盖范围。随着模型迭代和算力提升,Project Genie 有望成为创作者、教育工作者乃至游戏开发者的全新工具,为生成式 AI 在交互式内容创作领域打开新局面。
“让每个人都能用一句话打造专属的虚拟宇宙,是我们对生成式 AI 的长期愿景。”——Google DeepMind 团队