MUSE 基准的发布,直接解答了当前文本转 CAD 生成领域最核心的问题:如何评估模型能否产出真正可用于工业制造的复杂装配体。日前,研究团队在 arXiv 上发布了 MUSE,这是一个专注于可编辑边界表征(B-Rep)装配体的 Text-to-CAD 基准,将评估维度从单一的几何相似度扩展至可制造性、功能完整性和可装配性。
现有基准的局限:单一零件与几何相似度

当前主流的 Text-to-CAD 基准主要聚焦于生成单个零件,其评估方法依赖几何相似度指标。这类方法无法捕捉 CAD 模型在工业生产中的关键属性——一个外观相似但无法被制造、不具备机械功能或不能与其他零件装配的模型,本质上仍是无效的设计。MUSE 的针对性改进正是为了填补这一评估空白。
MUSE 的核心设计:面向工业级装配体
MUSE 基准的核心在于两点:其一,它要求模型生成的是复合型边界表征(B-Rep)装配体,而非单一零件。边界表征是一种精确描述三维物体表面几何与拓扑关系的数学表示,能够直接支撑制造加工。其二,基准数据集由实际设计实例与结构化描述配对而成,确保输入文本蕴含工程语义,而输出模型必须对应真实的装配逻辑。
评估维度:从外观到功能的三重考察
MUSE 的评估体系覆盖三个层次:
对工业设计的意义:加速从文本到产品的闭环
当前的文本驱动 3D 生成技术多由大语言模型(LLM)驱动,能够根据自然语言描述生成初步三维模型。但缺乏针对可制造性的评估,使得这些模型难以进入实际产品开发流程。MUSE 为研究者提供了一个明确的、以工业落地为导向的评估框架,有望推动 Text-to-CAD 技术从“能生成”迈向“能生产”。这一基准的发布,意味着算法研发者将不再仅仅追求视觉相似度,而必须同时解决工程可行性的挑战。
技术路线:基于结构化描述与 B-Rep 的数据构建
在数据构建层面,MUSE 将实际产品设计案例转化为带有结构化描述的训练数据。每一组配对都包含:代表产品几何与拓扑的完整边界表征文件,以及用工程语言描述的文本说明。这种设置迫使模型在生成时不仅要理解形状,还需要理解零件之间的装配关系与制造约束,这与纯粹基于图片或点云的生成任务有本质区别。