NVIDIA发布Cosmos3 Nano策略模型DROID版本

作者：袖梨 2026-06-03

NVIDIA发布Cosmos3 Nano策略模型DROID版本：世界行动模型新突破

关于AI行业的NVIDIA发布Cosmos3 Nano策略模型DROID版本。日前，NVIDIA在AI模型社区Hugging Face上正式发布了Cosmos3 Nano策略模型的DROID版本，模型ID为“nvidia/Cosmos3-Nano-Policy-DROID”。这一动作标志着NVIDIA在“世界行动模型”领域的持续深耕，为机器人及自动驾驶决策系统提供了一个轻量级、可部署的解决方案。

这款模型的参数规模属于Nano级别，专为策略模型（Policy Model）设计，意味着它可以直接用于指导机器人或智能体在物理世界中执行具体动作。说白了，它就像一个“行动大脑”，告诉AI该怎么做，而不只是“看到”世界。目前该模型已获得118次下载和12个点赞，社区反馈显示其技术潜力正在被开发者群体迅速验证。

没错，Cosmos3系列一直强调“世界模型+行动模型”的双重能力。而DROID版本进一步聚焦于策略优化，让模型能更快适应真实场景的动态变化。为什么要强调这一点？因为传统的视觉模型往往只擅长“看”，而无法高效地“做”。Cosmos3-Nano-Policy-DROID则试图打通这一瓶颈——它基于safetensors格式封装，配合diffusers生态，部署起来挺方便。

标签信息透露了更多细节：该模型属于cosmos3_omni系列，同时兼容diffusers和safetensors两种主流框架。这意味着开发者既可以在PyTorch生态中快速调用，也可以通过安全张量格式保障模型部署的安全性。值得一提的是，模型授权采用“license:other”标识，说明其使用条款可能需要单独查阅NVIDIA的官方许可页面，这也符合NVIDIA一贯的技术分发策略。

从应用层面来看，这条模型能做什么？咱们可以这样理解：

第一步：模型接收环境传感器数据（比如摄像头画面、激光雷达点云）。
第二步：它基于Cosmos世界模型对当前场景进行抽象理解。
第三步：通过Policy模块直接输出控制指令（比如“向左转15度”“抓取前方物体”）。

整个过程把“感知-理解-决策”压缩成一个端到端的推理流程，不用再分模块单独调参。对于机器人行业来说，这算是大幅降低了从仿真到真实环境（Sim-to-Real）的迁移成本。

确实，当前AI行业竞争激烈，各家都在推自己的“世界模型”方案。NVIDIA选择以Nano版本切入，可以看出其策略——通过轻量化模型快速占领边缘设备市场。毕竟在仓储机器人、家用服务机器人等场景下，算力约束是现实问题，谁能在小模型上实现高策略精度，谁就能抢占先机。何来“高精度”这一说？从DROID版本对策略层专门的训练优化来看，模型在动作连续性、低延迟响应上应该有针对性提升。

总而言之，NVIDIA这次发布Cosmos3 Nano策略模型DROID版本，既是对开源社区的技术回馈，也是其在具身智能赛道的一次精准落子。后续该模型在Hugging Face上的下载量和应用案例，咱们可以继续关注。