面向背景:有前端 / 全栈经验,目标是把 Agent 能力接入真实业务(对话 UI、知识库、工作流编排),而非做算法研究员。

写作形式:原理笔记 + 动手实验 + 本地 Q&A(ai/ 子目录,待建)+ 与前后端的交叉引用。
| 编号 | 主题 | 本地目录 | 状态 |
|---|---|---|---|
| 1 | 大模型认知与 Prompt 工程 | 1. LLM-Prompt/ | 待写 |
| 2 | LLM API 与模型选型 | 2. LLM-API/ | 待写 |
| 3 | RAG 检索增强生成 | 5. RAG-Knowledge/ | 待写 |
| 4 | Agent 与工具调用 | 4. Agent-Practice/ | 待写 |
| 5 | 应用框架 | 3. LangChain/ | 待写 |
| 6 | 模型部署与本地推理 | 6. Deploy-Platform/ | 待写 |
| 7 | 微调(按需深入) | 7. Fine-Tuning/ | 待写 |
| 8 | 多 Agent 与 MCP | 8. Multi-Agent-MCP/ | 原理文已有 |
| 9 | 平台工程与生产化 | 9. Production/ | 待写 |
| 10 | 实战案例 | 10. Case-Study/ | 待写 |
Phase A 认知(1 Prompt → 2 API) ← 1–2 周,快速出 Demo
Phase B 应用(3 RAG → 4 Agent → 5 框架) ← 核心能力,与业务最近
Phase C 模型(6 部署 → 7 微调按需) ← 需要私有化或领域适配时深入
Phase D 工程(8 多 Agent / MCP → 9 生产化) ← 企业级落地
Phase E 案例(10 行业实战) ← 串联 front / backend
| 里程碑 | 完成标准 |
|---|---|
| M1 | 用 API 完成一个带流式输出的对话页(对接 front §10 SSE) |
| M2 | 完成 RAG 问答 Demo:文档上传 → 检索 → 带引用回答 |
| M3 | 完成单 Agent Demo:至少 2 个 Tool(查 API + 查知识库) |
| M4 | 本地部署 Qwen / Llama(Ollama 或 vLLM)+ Dify 工作流 |
| M5 | 读通 多 Agent 通用原理 并实现最小 Orchestrator |
| M6 | 一个端到端企业场景案例(金融知识库 + 工作流 + 前端 UI) |
| 框架 | 特点 | 适用 |
|---|---|---|
| LangGraph | 图编排、状态机、可循环 | 复杂 Agent 工作流 |
| CrewAI | 角色 + 任务分工 | 多角色协作原型 |
| AutoGen | 对话式多 Agent | 研究 / 原型 |
| 自研 Orchestrator | 完全可控 | 企业生产平台 |
| 层 | 职责 | 索引 |
|---|---|---|
| 前端 | 对话 UI、流式 Markdown、文件上传 | front/all.md §10 |
| 后端 | BFF、SSE、鉴权、业务 API、向量库 | backend/all.md §9 |
| Agent | 编排、RAG、Tool、模型路由 | 本目录 |
| 类别 | 主流选型 |
|---|---|
| 云端 API | OpenAI、Claude、通义、DeepSeek、Moonshot |
| 本地推理 | Ollama、vLLM、llama.cpp |
| RAG 向量库 | pgvector、Milvus、Chroma、Qdrant |
| 应用框架 | LangChain、LangGraph、LlamaIndex |
| 低代码平台 | Dify、Coze、FastGPT |
| 微调 | LLaMA-Factory、Unsloth、ms-swift |
| 工具协议 | Function Calling、MCP |
| 可观测 | Langfuse、LangSmith、OpenTelemetry |