MUSE：面向可制造、功能与可装配的文本转CAD生成基准

作者：袖梨 2026-06-21

MUSE 基准的发布，直接解答了当前文本转 CAD 生成领域最核心的问题：如何评估模型能否产出真正可用于工业制造的复杂装配体。日前，研究团队在 arXiv 上发布了 MUSE，这是一个专注于可编辑边界表征（B-Rep）装配体的 Text-to-CAD 基准，将评估维度从单一的几何相似度扩展至可制造性、功能完整性和可装配性。

现有基准的局限：单一零件与几何相似度

当前主流的 Text-to-CAD 基准主要聚焦于生成单个零件，其评估方法依赖几何相似度指标。这类方法无法捕捉 CAD 模型在工业生产中的关键属性——一个外观相似但无法被制造、不具备机械功能或不能与其他零件装配的模型，本质上仍是无效的设计。MUSE 的针对性改进正是为了填补这一评估空白。

MUSE 的核心设计：面向工业级装配体

MUSE 基准的核心在于两点：其一，它要求模型生成的是复合型边界表征（B-Rep）装配体，而非单一零件。边界表征是一种精确描述三维物体表面几何与拓扑关系的数学表示，能够直接支撑制造加工。其二，基准数据集由实际设计实例与结构化描述配对而成，确保输入文本蕴含工程语义，而输出模型必须对应真实的装配逻辑。

评估维度：从外观到功能的三重考察

MUSE 的评估体系覆盖三个层次：

可制造性：检查模型是否具备能够被数控机床或增材制造设备加工的特征，例如合理的壁厚、无无法加工的尖角或悬空结构。
功能性：评估生成装配体是否能够实现设计意图中的机械功能，例如轴孔配合的间隙是否合理、运动副是否可行。
可装配性：验证各零件之间是否存在干涉，以及正确的装配顺序和约束是否被隐含地满足。

对工业设计的意义：加速从文本到产品的闭环

当前的文本驱动 3D 生成技术多由大语言模型（LLM）驱动，能够根据自然语言描述生成初步三维模型。但缺乏针对可制造性的评估，使得这些模型难以进入实际产品开发流程。MUSE 为研究者提供了一个明确的、以工业落地为导向的评估框架，有望推动 Text-to-CAD 技术从“能生成”迈向“能生产”。这一基准的发布，意味着算法研发者将不再仅仅追求视觉相似度，而必须同时解决工程可行性的挑战。

技术路线：基于结构化描述与 B-Rep 的数据构建

在数据构建层面，MUSE 将实际产品设计案例转化为带有结构化描述的训练数据。每一组配对都包含：代表产品几何与拓扑的完整边界表征文件，以及用工程语言描述的文本说明。这种设置迫使模型在生成时不仅要理解形状，还需要理解零件之间的装配关系与制造约束，这与纯粹基于图片或点云的生成任务有本质区别。