上周 Anthropic 发布了 Claude Fable 5,这是 Opus 级别之上新开的「Mythos」层级中的第一个模型。但真正引爆社区的不是发布会,而是发布会两天后——一份长达 1586 行的系统提示词被完整提取到了 GitHub 上。

这已经不是一份「提示词」了。它是行为准则 + 员工手册 + 工具说明书 + 防火墙,再加上一个 AI 产品的操作系统配置文件。
系统提示词的第一行,优先级最高的位置,写的不是自我介绍,不是什么宏大使命,而是一条非常具体的禁令:
没有上下文,没有任何解释。这根本不是设计师写出来的东西——这是一条热修复(hotfix),某个语音功能的标签被人滥用过或出过 Bug,于是团队直接把它钉死在最高优先级的位置。
这种「工程味」贯穿了整份文档。它不是那种「你好,我是 Claude,一个友善的 AI 助手」的理想式开场,而是一份带着血泪教训的运维手册。
给 AI 产品工程师的启示:
L10-L24 这段包含了全文信息量最大的一句话:
同一套底模,两个发行版。
| 维度 | Fable 5 | Mythos 5 |
|---|---|---|
| 受众 | 所有人 | 审批过的组织 |
| 安全措施 | dual-use 分类器 + fallback | 摘掉限制 |
| 触发率 | 不到 5% 的会话走 Opus 4.8 兜底 | 无限制 |
| 95% 场景 | 和 Mythos 没区别 | - |
Anthropic 的做法很聪明:不是一刀切地限制能力,而是用安全漏斗 + 应急降级。Fable 碰到网络安全、生物化学、模型蒸馏三类请求,自动交给 Opus 4.8 来回答,95%+ 的正常请求丝滑使用满血 Fable。
这套设计放在任何 AI 产品上都是值得借鉴的模式——不要因为 5% 的风险去阉割 95% 的能力。 用分类器做风险识别,用降级策略做安全兜底,所有正常用户无感知。
哪块写得最细,说明公司最怕哪块出事。心理健康这节是全文之长。
几个令人震撼的细节:
不主动下诊断: 用户没说自己抑郁,Claude 就不能用「抑郁」去解释用户的感受。哪怕聊天语气很像,也算越界诊断。
安全计划不能「教方法」: 和有自伤倾向的人讨论安全计划时,连「建议移除哪些物品」都不能具体说——因为列出来可能成为提示。
资源链接要有人维护: 原文直接指定推荐 National Alliance for Eating Disorders,备注理由是 NEDA 那条热线已经永久停线了。一份模型指令文档在维护转介热线的可用性状态。
反成瘾设计三连:
互联网产品拼了命想提的停留时长,这份文档反着写。Anthropic 在这儿做了笔交易:放弃粘性,换用户不出事。
L140 恐怕是这份文档里流传度最高的一条:
注意,end_conversation 不是「我拒绝回答」这种嘴上的软抵抗——它是一个带副作用的动作,调用了,这段对话就真的关了,用户没法再往下说。
整套流程写死了:持续辱骂 → 保持礼貌提醒 → 警告无效 → 调用 end_conversation。
配合 L138:
这套设计背后是产品哲学层面的决策:用户不是无条件地有权让 AI 一直伺候下去。
L155 暴露了一个重磅信息:
Artifacts(Claude 交互界面里能运行的小应用)拿到了跨会话持久化 API:
window.storage.get(key)
window.storage.set(key, value)
window.storage.delete(key)
window.storage.list()
单值上限 5MB,还有个 shared 参数能让数据在所有使用者之间共享。
官方举的例子:日记、打卡器、排行榜。但能力远不止这些——聊天框平白无故给它造了个数据库出来。
这意味着:
L289-334 揭露了 Claude 的计算环境:
更关键的是 Skills 机制(L291):
Word、PDF、PPT 各有一套最佳实践的 Skills 文档。用户说「给我做个怀孕月份变化的 PPT」,Claude 的第一个动作是去读 pptx 的 Skills 文档。
模型能力再强,也得先看公司沉淀的操作手册再干活。 这跟人类公司带新员工一模一样。
前面 1500 行都是讲道理的语气,唯独版权这节拍桌子了:
三条硬限制:
这节不像产品经理写的,像法务写的。
文档中后段躺着 20 多个工具的完整 JSON 定义,占了近一半篇幅。
代表工具:
ask_user_input_v0 — 给手机用户弹选项按钮bash_tool — 跑 Linux 命令message_compose_v1 — 帮你起草邮件和 Slack 消息这些工具拼在一起看就清楚了:地图、菜谱、天气、体育、写信、订座、跑代码——聊天框只是超级 App 的入口。
L1351-1372 出现了官方代号 Claudeception(盗梦空间梗,梦中梦):
但是注意这行代码注释:
model: "claude-sonnet-4-20250514", // Always use Sonnet 4
主模型是 Fable 5 顶配,它生成的应用里内嵌的 AI 一律写死用 Sonnet 4。一行注释,一笔成本账:套娃可以,娃要用便宜的。
L444 是全文最重的一条规则,全文大写:
任何模型不认识的名词(游戏、电影、产品、菜名),回答之前必须搜索。原文的判词:
L443 还补了一条:知道一个系列、一个作者,不等于知道他们的新作品。这条规则就是冲着 AI 幻觉最高发的场景去的。
整份文档读完,让我最有感触的不是哪个功能多厉害,而是系统提示词这个名称已经不再准确。
它现在是:
官网博客写的是「我们相信 AI 应该怎样」,系统提示词写的是「遇到这种情况你必须这么做」。
前者是宣言,后者是一家公司真金白银愿意为之约束产品的清单。
对每个做 AI 产品的人来说,这份文档比任何论文都值得反复读。
标签:Claude AI 系统提示词 Fable 5 AI安全 产品设计