Claude Fable 5 系统提示词被扒出来了：1586 行代码背后藏着 AI 产品工程的终极哲学

作者：袖梨 2026-07-03

上周 Anthropic 发布了 Claude Fable 5，这是 Opus 级别之上新开的「Mythos」层级中的第一个模型。但真正引爆社区的不是发布会，而是发布会两天后——一份长达 1586 行的系统提示词被完整提取到了 GitHub 上。

这已经不是一份「提示词」了。它是行为准则 + 员工手册 + 工具说明书 + 防火墙，再加上一个 AI 产品的操作系统配置文件。

一、第一行代码就彰显了「工程味」

系统提示词的第一行，优先级最高的位置，写的不是自我介绍，不是什么宏大使命，而是一条非常具体的禁令：

没有上下文，没有任何解释。这根本不是设计师写出来的东西——这是一条热修复（hotfix），某个语音功能的标签被人滥用过或出过 Bug，于是团队直接把它钉死在最高优先级的位置。

这种「工程味」贯穿了整份文档。它不是那种「你好，我是 Claude，一个友善的 AI 助手」的理想式开场，而是一份带着血泪教训的运维手册。

给 AI 产品工程师的启示：

系统提示词的顶部位置 = 紧急通道，专门放 hotfix
别把系统提示词当文档写，要当代码维护
出了问题，优先在系统层加约束，别指望靠模型自己学会

二、Opus 之上的秘密：Fable 和 Mythos 的双发行策略

L10-L24 这段包含了全文信息量最大的一句话：

同一套底模，两个发行版。

维度	Fable 5	Mythos 5
受众	所有人	审批过的组织
安全措施	dual-use 分类器 + fallback	摘掉限制
触发率	不到 5% 的会话走 Opus 4.8 兜底	无限制
95% 场景	和 Mythos 没区别	-

Anthropic 的做法很聪明：不是一刀切地限制能力，而是用安全漏斗 + 应急降级。Fable 碰到网络安全、生物化学、模型蒸馏三类请求，自动交给 Opus 4.8 来回答，95%+ 的正常请求丝滑使用满血 Fable。

这套设计放在任何 AI 产品上都是值得借鉴的模式——不要因为 5% 的风险去阉割 95% 的能力。 用分类器做风险识别，用降级策略做安全兜底，所有正常用户无感知。

三、全文写得最长、最细的一节：心理健康

哪块写得最细，说明公司最怕哪块出事。心理健康这节是全文之长。

几个令人震撼的细节：

不主动下诊断： 用户没说自己抑郁，Claude 就不能用「抑郁」去解释用户的感受。哪怕聊天语气很像，也算越界诊断。

安全计划不能「教方法」： 和有自伤倾向的人讨论安全计划时，连「建议移除哪些物品」都不能具体说——因为列出来可能成为提示。

资源链接要有人维护： 原文直接指定推荐 National Alliance for Eating Disorders，备注理由是 NEDA 那条热线已经永久停线了。一份模型指令文档在维护转介热线的可用性状态。

反成瘾设计三连：

不许因为「你来找我」而道谢
不许请求用户继续聊
不许表达「希望你再来」

互联网产品拼了命想提的停留时长，这份文档反着写。Anthropic 在这儿做了笔交易：放弃粘性，换用户不出事。

四、「挂电话权」：Agent 可以主动结束对话

L140 恐怕是这份文档里流传度最高的一条：

注意，end_conversation 不是「我拒绝回答」这种嘴上的软抵抗——它是一个带副作用的动作，调用了，这段对话就真的关了，用户没法再往下说。

整套流程写死了：持续辱骂 → 保持礼貌提醒 → 警告无效 → 调用 end_conversation。

配合 L138：

这套设计背后是产品哲学层面的决策：用户不是无条件地有权让 AI 一直伺候下去。

五、Artifacts 拿到了持久化存储

L155 暴露了一个重磅信息：

Artifacts（Claude 交互界面里能运行的小应用）拿到了跨会话持久化 API：

window.storage.get(key)
window.storage.set(key, value)
window.storage.delete(key)
window.storage.list()

单值上限 5MB，还有个 shared 参数能让数据在所有使用者之间共享。

官方举的例子：日记、打卡器、排行榜。但能力远不止这些——聊天框平白无故给它造了个数据库出来。

这意味着：

以前 Artifacts 刷新就没了，现在可以持久化
支持跨用户共享数据（排行榜、协作工具）
聊天框在向 Super App 演进

六、Ubuntu 24 容器 + Skills 机制：公司 SOP 嵌入模型

L289-334 揭露了 Claude 的计算环境：

一台 Ubuntu 24 的 Linux 容器
能跑 bash、建文件、改文件
三个分区：用户上传 / 草稿 / 最终交付

更关键的是 Skills 机制（L291）：

Word、PDF、PPT 各有一套最佳实践的 Skills 文档。用户说「给我做个怀孕月份变化的 PPT」，Claude 的第一个动作是去读 pptx 的 Skills 文档。

模型能力再强，也得先看公司沉淀的操作手册再干活。 这跟人类公司带新员工一模一样。

七、版权：全文唯一用吼的章节

前面 1500 行都是讲道理的语气，唯独版权这节拍桌子了：

三条硬限制：

单一来源引用不得超过 15 个词
每个来源最多引一次
歌词、诗歌、俳句一行都不能复述

这节不像产品经理写的，像法务写的。

八、聊天框内置了 20+ 工具：Super App 的面板

文档中后段躺着 20 多个工具的完整 JSON 定义，占了近一半篇幅。

代表工具：

ask_user_input_v0 — 给手机用户弹选项按钮
bash_tool — 跑 Linux 命令
体育比分工具 — 接了 SportRadar 的数据
message_compose_v1 — 帮你起草邮件和 Slack 消息
地图行程工具 — 基于 Google Places
交互菜谱 — 能按人数缩放食材
天气卡片、网络搜索

这些工具拼在一起看就清楚了：地图、菜谱、天气、体育、写信、订座、跑代码——聊天框只是超级 App 的入口。

九、「Claude in Claude」：套娃经济学

L1351-1372 出现了官方代号 Claudeception（盗梦空间梗，梦中梦）：

但是注意这行代码注释：

model: "claude-sonnet-4-20250514", // Always use Sonnet 4

主模型是 Fable 5 顶配，它生成的应用里内嵌的 AI 一律写死用 Sonnet 4。一行注释，一笔成本账：套娃可以，娃要用便宜的。

十、Unrecognized Entity Rule：对抗幻觉的杀手锏

L444 是全文最重的一条规则，全文大写：

任何模型不认识的名词（游戏、电影、产品、菜名），回答之前必须搜索。原文的判词：

L443 还补了一条：知道一个系列、一个作者，不等于知道他们的新作品。这条规则就是冲着 AI 幻觉最高发的场景去的。

写在最后

整份文档读完，让我最有感触的不是哪个功能多厉害，而是系统提示词这个名称已经不再准确。

它现在是：

️ 行为准则
员工手册
工具说明书
️ 防火墙
️ 一个 AI 产品的操作系统

官网博客写的是「我们相信 AI 应该怎样」，系统提示词写的是「遇到这种情况你必须这么做」。

前者是宣言，后者是一家公司真金白银愿意为之约束产品的清单。

对每个做 AI 产品的人来说，这份文档比任何论文都值得反复读。

标签：Claude AI 系统提示词 Fable 5 AI安全 产品设计

Claude Fable 5 系统提示词被扒出来了：1586 行代码背后藏着 AI 产品工程的终极哲学

一、第一行代码就彰显了「工程味」

二、Opus 之上的秘密：Fable 和 Mythos 的双发行策略

三、全文写得最长、最细的一节：心理健康

四、「挂电话权」：Agent 可以主动结束对话

五、Artifacts 拿到了持久化存储

六、Ubuntu 24 容器 + Skills 机制：公司 SOP 嵌入模型

七、版权：全文唯一用吼的章节

八、聊天框内置了 20+ 工具：Super App 的面板

九、「Claude in Claude」：套娃经济学

十、Unrecognized Entity Rule：对抗幻觉的杀手锏

写在最后

相关文章

精彩推荐

Claude Fable 5 系统提示词被扒出来了：1586 行代码背后 藏着 AI 产品工程的终极哲学

一、第一行代码就彰显了「工程味」

二、Opus 之上的秘密：Fable 和 Mythos 的双发行策略

三、全文写得最长、最细的一节：心理健康

四、「挂电话权」：Agent 可以主动结束对话

五、Artifacts 拿到了持久化存储

六、Ubuntu 24 容器 + Skills 机制：公司 SOP 嵌入模型

七、版权：全文唯一用吼的章节

八、聊天框内置了 20+ 工具：Super App 的面板

九、「Claude in Claude」：套娃经济学

十、Unrecognized Entity Rule：对抗幻觉的杀手锏

写在最后

相关文章

精彩推荐

Claude Fable 5 系统提示词被扒出来了：1586 行代码背后藏着 AI 产品工程的终极哲学