实测project genie 12：一场3D世界生成实验

作者：袖梨 2026-05-26

Project Genie，谷歌DeepMind在2026年1月30日向公众开放的这个实验性研究原型，说白了就是能让你用自然语言“写”出一个3D世界。实测下来，它基于Genie 3世界模型，直接把文字描述变成实时生成、可交互的三维空间，每秒24帧画面，挺震撼的。说实话，这不就是创世神玩法吗？

文字转世界，真能行吗？实测第一步，输入“迷雾森林，有古老石桥和发光的蘑菇”。几秒钟后，一个可探索的场景就出现在眼前。你可以在里面走，视角自由移动，环境会跟着你实时渲染。这和预渲染的静态图完全不同，Genie 3世界模型学的是环境如何运作，根据你的操作预测并生成下一帧。

三种玩法，其实挺直白目前Project Genie支持三种核心操作：用文字创造世界、用图像生成环境、然后在生成的世界里自由探索。这确实算是从“观看”到“互动”再到“创造”的跨越。对于AI绘画玩腻了的人来说，这个可交互的3D生成体验，才是真正的进化方向。

体验门槛不低现在服务只向美国地区的Google AI Ultra订阅用户开放，咱们国内用户暂时只能看看评测。不过官方说了，计划后续扩展更多国家并提供开发者API。凭什么只有美国用户先玩？这个限制确实让人心痒——但换个角度想，这也说明技术还处在早期实验阶段，等成熟了自然会有官方渠道接入。

世界模型是AGI的关键一步吗？DeepMind将Genie 3定位为通向通用人工智能的里程碑，因为它展示的是对三维世界运作逻辑的理解，而不仅仅是生成两张好看的图。能实时预测并生成可探索环境的AI，确实比只会画画的模型更接近“理解世界”这个目标。

Project Genie这个实验原型，打开了一扇新的大门。从文字到可交互的3D世界生成，这简直就是给创作者配了一把万能钥匙。未来开发者API开放后，游戏开发、虚拟空间设计、甚至教育模拟，或许都要被重新定义——这难道不令人期待吗？

相关文章