LLM Wiki 构建手册：可直接落地的标准流程

作者：袖梨 2026-07-03

快速上手构建专属LLM Wiki，一份清晰、可落地的标准流程，帮你高效组织和管理知识。核心内容：1. 从资料准备到增量编译的完整构建流程2. 知识库约束配置与全局索引设计3. 针对不同规模知识库的两种查询模式

是时候开始动手构建LLM Wiki了

今天的内容，尽量遵循 Karpathy 原生 LLM Wiki 范式与业界通用工程实践。但毕竟是一个新事物，至于到底好不好用，我们需要自己去尝试，自己去寻找适用和不适用的场景。

—

资料准备

raw只是一个示例，至于起什么名字，你自己决定。

—

知识库约束配置

可新建 SCHEMA.md 或 PURPOSE.md 配置文件，用于：

作用：约束 LLM 提炼知识的方向，保证全站风格、标准统一。

—

增量编译

以文件为粒度做增量编译：

读取 /raw中新增/变更文件（旧文件通过哈希缓存自动跳过，不重复处理）
提炼核心实体、概念、论点，生成完整、独立、结构化的 Wiki 单页（不是碎片、不是分块）
自动在页面间建立前向 [[wikilink]] 知识网络（提醒：建议反向link不要直接写到wiki页面中，增加页面的复杂度和tokens消耗。课题使用脚本来建立一个反向文档，在需要时读取。）
级联更新：新增资料会自动更新所有相关旧页面、旧链接、冲突信息（提醒：级联更新有可能会出现级联爆炸，大幅提高tokens的消耗，甚至导致级联失败，在这里可以添加限制，例如级联更新最大深度＜20等）
自动刷新全局索引目录

—

全局索引

index.md 是 LLM Wiki 的系统级“目录”表与全局入口，作用是让模型看懂知识库全貌：

存储：所有页面标题 + 核心摘要
中小规模：单文件顶层索引即可使用
大规模优化：当 index 总内容超出模型上下文窗口、或页面数量过多时，分层拆分多级索引。例如，保留全局index.md，但其内容是指向topics的，然后topics下有具体的主题索引md，例如 topics/Agent.md，Agent.md中是当前主题下的wiki页面索引。具体要分多少层，需要按照你项目的要求来决策。

—

查询模式