MUSE:面向可制造、功能与可装配的文本转CAD生成基准

作者:袖梨 2026-06-21

MUSE 基准的发布,直接解答了当前文本转 CAD 生成领域最核心的问题:如何评估模型能否产出真正可用于工业制造的复杂装配体。日前,研究团队在 arXiv 上发布了 MUSE,这是一个专注于可编辑边界表征(B-Rep)装配体的 Text-to-CAD 基准,将评估维度从单一的几何相似度扩展至可制造性、功能完整性和可装配性。

现有基准的局限:单一零件与几何相似度

当前主流的 Text-to-CAD 基准主要聚焦于生成单个零件,其评估方法依赖几何相似度指标。这类方法无法捕捉 CAD 模型在工业生产中的关键属性——一个外观相似但无法被制造、不具备机械功能或不能与其他零件装配的模型,本质上仍是无效的设计。MUSE 的针对性改进正是为了填补这一评估空白。

MUSE 的核心设计:面向工业级装配体

MUSE 基准的核心在于两点:其一,它要求模型生成的是复合型边界表征(B-Rep)装配体,而非单一零件。边界表征是一种精确描述三维物体表面几何与拓扑关系的数学表示,能够直接支撑制造加工。其二,基准数据集由实际设计实例与结构化描述配对而成,确保输入文本蕴含工程语义,而输出模型必须对应真实的装配逻辑。

评估维度:从外观到功能的三重考察

MUSE 的评估体系覆盖三个层次:

  • 可制造性:检查模型是否具备能够被数控机床或增材制造设备加工的特征,例如合理的壁厚、无无法加工的尖角或悬空结构。
  • 功能性:评估生成装配体是否能够实现设计意图中的机械功能,例如轴孔配合的间隙是否合理、运动副是否可行。
  • 可装配性:验证各零件之间是否存在干涉,以及正确的装配顺序和约束是否被隐含地满足。

对工业设计的意义:加速从文本到产品的闭环

当前的文本驱动 3D 生成技术多由大语言模型(LLM)驱动,能够根据自然语言描述生成初步三维模型。但缺乏针对可制造性的评估,使得这些模型难以进入实际产品开发流程。MUSE 为研究者提供了一个明确的、以工业落地为导向的评估框架,有望推动 Text-to-CAD 技术从“能生成”迈向“能生产”。这一基准的发布,意味着算法研发者将不再仅仅追求视觉相似度,而必须同时解决工程可行性的挑战。

技术路线:基于结构化描述与 B-Rep 的数据构建

在数据构建层面,MUSE 将实际产品设计案例转化为带有结构化描述的训练数据。每一组配对都包含:代表产品几何与拓扑的完整边界表征文件,以及用工程语言描述的文本说明。这种设置迫使模型在生成时不仅要理解形状,还需要理解零件之间的装配关系与制造约束,这与纯粹基于图片或点云的生成任务有本质区别。

相关文章

精彩推荐