实测project genie 12:一场3D世界生成实验

作者:袖梨 2026-05-26

Project Genie,谷歌DeepMind在2026年1月30日向公众开放的这个实验性研究原型,说白了就是能让你用自然语言“写”出一个3D世界。实测下来,它基于Genie 3世界模型,直接把文字描述变成实时生成、可交互的三维空间,每秒24帧画面,挺震撼的。说实话,这不就是创世神玩法吗?

文字转世界,真能行吗?实测第一步,输入“迷雾森林,有古老石桥和发光的蘑菇”。几秒钟后,一个可探索的场景就出现在眼前。你可以在里面走,视角自由移动,环境会跟着你实时渲染。这和预渲染的静态图完全不同,Genie 3世界模型学的是环境如何运作,根据你的操作预测并生成下一帧。

三种玩法,其实挺直白目前Project Genie支持三种核心操作:用文字创造世界、用图像生成环境、然后在生成的世界里自由探索。这确实算是从“观看”到“互动”再到“创造”的跨越。对于AI绘画玩腻了的人来说,这个可交互的3D生成体验,才是真正的进化方向。

体验门槛不低现在服务只向美国地区的Google AI Ultra订阅用户开放,咱们国内用户暂时只能看看评测。不过官方说了,计划后续扩展更多国家并提供开发者API。凭什么只有美国用户先玩?这个限制确实让人心痒——但换个角度想,这也说明技术还处在早期实验阶段,等成熟了自然会有官方渠道接入。

世界模型是AGI的关键一步吗?DeepMind将Genie 3定位为通向通用人工智能的里程碑,因为它展示的是对三维世界运作逻辑的理解,而不仅仅是生成两张好看的图。能实时预测并生成可探索环境的AI,确实比只会画画的模型更接近“理解世界”这个目标。

Project Genie这个实验原型,打开了一扇新的大门。从文字到可交互的3D世界生成,这简直就是给创作者配了一把万能钥匙。未来开发者API开放后,游戏开发、虚拟空间设计、甚至教育模拟,或许都要被重新定义——这难道不令人期待吗?

相关文章

精彩推荐