NVIDIA 开源 Cosmos 3:首个专注物理 AI 的全能模型
Hugging Face 博客日前发布消息,NVIDIA 正式开源了 Cosmos 3 模型。这是业界第一个面向物理 AI 推理与行动的全能开源模型,专为理解和操作真实世界物理规则而设计。该模型由 NVIDIA 团队推出,目前在 Hugging Face 平台可以获取。

什么是物理 AI?
物理 AI 指的是能让机器理解重力、摩擦力、碰撞等物理规律,并根据这些规律做出行动判断的人工智能。Cosmos 3 将语言理解与物理常识结合在一起,给定一个任务描述(比如“把桌上的杯子拿起来”),模型不仅知道“杯子”是什么,还能推理出伸手的角度、力度和避开障碍物的路径。
模型开源意味着什么
开源使得全球开发者、研究机构可以自由下载 Cosmos 3 的权重和代码,用于机器人控制、自动驾驶仿真、工业装配等场景。开发者无需从头训练,只需在 Cosmos 3 基础上微调,就能快速构建适用于自己硬件的物理决策系统。
核心能力与应用场景
其中物理推理与行动模型的突出优势在于:它不需要人为编写规则,而是通过大量物理交互数据学习常识。这使得在未知环境中也能做出合理决策。
如何获取与使用
开发者可以直接访问 Hugging Face 上的 NVIDIA 模型库,搜索“Cosmos 3”即可找到对应的仓库。模型权重基于 NVIDIA 许可协议开放,支持 PyTorch 等主流框架。官方还提供了推理示例与微调脚本,降低上手门槛。值得注意的是,该模型对显存有一定要求,推荐使用 A100 或 H100 级别 GPU 运行完整版本,但 NVIDIA 也提供了量化版本以适配更广硬件。
开源背景与意义
此前,物理 AI 模型多由少数企业闭源维护,研发成本高。NVIDIA 此次将 Cosmos 3 完全开源,相当于给整个行业送了一份基础工具。Hugging Face 社区已有不少用户开始基于该模型构建机器人仿真接口。未来,物理 AI 开发者可以像调用语言模型一样调用物理模型,加速从实验室到工厂的落地。