3个关键点搞懂0.42WM:τ0-WM世界模型解读
其实很简单,咱们就抓住三个核心事实,就能搞懂这个τ0-WM世界模型。第一个关键点:数据规模。上海创智学院罗剑岚团队发布的这个模型,参数量直接飙到5B,预训练数据规模高达约3万小时。这挺颠覆的是吧?凭什么?因为真机遥操作数据第一次成了绝对主力,占了足足17800小时。这相当于一台机器人,连续两年、一天24小时不停地被人类遥操作,数据量就是这么堆出来的。

第二个关键点,就是模型引入了测试时计算机制(Test-Time Computation)。这玩意儿有什么用呢?它让机器人在执行任务前,对多个候选动作进行排序,选出最优方案。质量不够怎么办?调用模拟器修正后再执行。这一点就挺聪明的,等于给机器人装了一个会“预演”的大脑,而不是傻乎乎地直接上手。
第三个关键点要看实际表现。τ0-WM在四个长程精细操作任务中,包括Toolbox(工具收纳)、School Bag等场景,平均成功率都超过了其他对标模型。没错,真机数据训练出来的模型,确实在精细控制上更靠谱。它不是光会预测画面,还能生成精准的动作。

现在行业里都说真机数据是奢侈品,难以规模化,只能放在最后的微调阶段。但罗剑岚团队直接用事实证明了,这玩意完全可以拿来砸预训练。而且一砸,就是全球最大规模的开源预训练具身世界模型。这就打破了行业原有的认知,不是吗?
总的来说,τ0-WM这个模型确实挺实在。5B参数、3万小时数据、测试时计算,这几个数字组合在一起,让机器人在复杂任务中的成功率稳步提升。未来具身智能怎么走?也许就该像这样,先让数据飞轮转起来再说。