提示词编写的第一步:明确任务结构与参数项
混元大模型的 API 支持图像、3D 等模态生成,开发者编写提示词时应先确定输出类型(文本、图像或 3D 模型),再构造结构化描述。例如生成 3D 模型时,提示词需包含“样式、形状和细节”三个层次,并选择面数范围(30K–150K)、是否启用 PBR 材质、多边形类型(三角形/四边形)。这些参数直接决定输出质量与渲染效果,是配置的核心。

提示词格式:从自然语言到结构化指令
对于图像生成,使用“文本提示”即可,例如源 3 中的示例:“Ultra-photorealistic portrait of a young woman…”。开发者可在此基础上追加“风格”“光线”“色彩”等修饰词。对于 3D 模型,混元 3D V3 支持三种输入方式:文本描述、图片上传、草图绘制。若用文本,需具体指出形状和细节,如“一只金属质感的机器人,有光滑表面和红色发光眼睛”。提供多视图(正面、背面、左侧、右侧)可提升重建精度。
参数配置的关键项一览
调用 API 时的参数传递
开发者通过 API 接口调用时,需将上述参数封装为 JSON 对象。例如生成 3D 模型的标准请求体结构包含 prompt(文本描述)、face_count(面数)、pbr_material(布尔值)、polygon_type(字符串)。混元大模型支持多种自定义参数设置,官方文档提供了完整字段说明,建议参考产品文档中的“请求示例”调试参数组合。
注意事项与优化技巧
首先,避免提示词过于笼统,如“生成一个杯子”不如“生成一个白色陶瓷马克杯,带有哑光表面和圆润手柄”。其次,利用混元大模型对上下文的支持(Hy3 preview 最大 256K 上下文),可在提示词中插入参考图片的 URL 或 base64 数据,实现更精准的风格迁移。最后,对于生产级任务,建议先使用低面数测试效果,确认后再提高面数并启用 PBR,以节省 API 调用成本。
小结
混元大模型的提示词编写本质是将“创意意图”转化为“结构化参数”。开发者掌握“文本描述 + 面数/材质/多边形类型”的配置框架后,即可通过 API 快速生成高质量的图像或 3D 资产。实际应用中,建议优先阅读产品文档中的常见问题与最佳实践,结合具体场景调整参数。