τ0-WM可不是什么自行车,要是搜错了关键词,其实它是全球最大开源具身世界模型。上海创智学院副教授罗剑岚团队,刚刚发布了这个参数量5B的大家伙,预训练数据规模达到3万小时。其中1.78万小时的真机遥操作数据,成了预训练的绝对主力,这真的颠覆了行业对真机数据“奢侈品”的认知。
为什么说它挺厉害呢?因为过去大家普遍认为真机数据采集成本高、难以规模化,只能用在最后的微调阶段。但τ0-WM直接用事实打了脸——它把大规模真机数据砸进了预训练,这就像给机器人装上了会“预演”的大脑,让它能提前判断各种动作的后果。

咱们来看看数据有多惊人:3万小时的预训练数据,是目前全球开源预训练具身世界模型中最大的。其中1.78万小时是什么概念?相当于一台机器人连续两年、一天24小时不停地被人类遥操作。模型还结合了测试时计算(Test-Time Computation),让机器人在执行前对多个候选动作进行排序,选出最优方案。
这套方法的优势体现在实操上:在四个长程精细操作任务,包括Toolbox(工具收纳)、School Bag等场景中,τ0-WM的平均成功率超过了对标的其他模型。质量不够怎么办?可以调用模拟器修正后再执行,这就打开了一个新思路——预训练与后训练的结合,让机器人变得更聪明。

τ0-WM的开源意味着什么?它让整个具身智能领域多了一个强大而可靠的基座模型。当业界还在为几百小时的数据发愁时,罗剑岚团队已经用几年如一日的积累,构建起了数据飞轮。这难道不是一件值得兴奋的事吗?