刚刚:AI颠覆物理模拟:一句话精准仿真:学术圈半壁江山联手耗时24个月研究成果

作者:袖梨 2026-07-01

img_6a4474dbaba5a30.webp

生成结果可不仅是一个视频,其中还包含物体运动的各种参数。

img_6a4474dbaba5f31.webp

接下来可以分为三个视角,同时追踪模拟水滴的运动……

img_6a4474dbaba6132.webp

对于人物动作,也可以遵循提示词精确模拟。

img_6a4474dbaba6333.webp

img_6a4474dbaba6534.webp

这是一项涉及20多个组织,为期24个月的大规模合作研究:

学术界,有清华、北大、港大、CMU、马里兰、哥伦比亚、斯坦福、MIT……说是学术圈半壁江山都参与了也不为过。

产业界,也有英伟达、太极图形,以及MIT-IBM Watson AI Lab这样的联合实验室助阵。

img_6a4474dbaba6735.webp

OpenAI在2月初次演示Sora时,曾称它是“世界的模拟器”。

相比之下,Genesis不仅物理模拟更精确,还同时有更多能力:

一句话总结:Genesis是一个全面的物理模拟平台,专为通用机器人、具身AI和物理AI应用而设计。

img_6a4474dbaba6936.webp

共同一作、CMU博士生周衔详细介绍了Genesis的各种能力,迅速引起业界轰动。

img_6a4474dbaba6b37.webp

其中大家格外关注的一点是生成速度。

它提供的模拟速度比现实世界快约430000倍,并且只需26秒即可在单个RTX4090上训练能转移到真实机器人的运动策略。

img_6a4474dbaba6d38.webp

据周衔介绍,Genesis的物理引擎用纯Python代码开发,同时比现有的GPU加速堆栈(如英伟达Isaac Gym和开源的MJX)快10-80倍。

同时,速度的提高不会影响仿真精度。

img_6a4474dbaba6e39.webp

目前,团队正在开源底层物理引擎和模拟平台,对生成式框架的访问将在不久的将来逐步推出。

不得不说,从一句话生成视频到一句话生成物理世界,2024年的进展实在是太快了。

生成4D物理世界

Genesis由从头开始的通用物理引擎提供支持,将各种物理求解器及其耦合集成到统一的框架中。该核心物理引擎通过上层运行的生成Agent框架进一步增强,旨在为机器人及其他领域实现完全自动化的数据生成,包括以下模态:

img_6a4474dbaba70310.webp

机器人策略

除了角色的运动,Genesis还可以自主提出机器人任务、设计环境、编写奖励函数,并最终自动生成机器人策略。

img_6a4474dbaba72311.webp

同时支持Sim2Real,把在模拟环境训练好的策略转移到真实硬件机器人中。

img_6a4474dbaba74312.webp

img_6a4474dbaba76313.webp

很可惜还有一个人形机器人单脚跳跃只有模拟演示,因为团队的机器人坏掉了……

img_6a4474dbaba78314.webp

另外除了机器人,无人机编队也可以模拟,并呈现出正确的数量关系。

img_6a4474dbaba7a315.webp

3D & 全互动场景生成

img_6a4474dbaba7c316.webp

开放世界铰接式物体

生成开放世界铰接式物体的mesh资产,质量超越了人工注释,更多详细信息将随之后的论文一起公开。

img_6a4474dbaba7e317.webp

软体机器人

不只是各种刚性物体,Genesis针对软性的机器人也能够实现逼真的模拟。

img_6a4474dbaba80318.webp

img_6a4474dbaba82319.webp

面部动画和语音

Genesis还能够处理面部动作和表情的生成:

img_6a4474dbaba83320.webp

同时还能向其中添加语音,并在面部表情不断变化的同时,保持口型与说话内容的匹配:

此外,Genesis相关论文已进入提交阶段,将于稍后公开。

相关文章

精彩推荐