LLM Primer IV — 用 MCP 设计 AI 认知:系列导读与目录

"一个智能体的上限,就是它能看到的上下文、能调到的工具、能记住的事情。"欢迎来到 LLM Primer 系列第四卷,以及配套的章节走读。接下来 14 天,每天一章,我们打开 Model Context Protocol 和它撑起的那一层认知架构,看哪些选择决定了一个智能体系统是悄悄跑得起来,还是悄悄垮掉。

这一卷为什么存在

第 I、II、III 卷分别给了你模型本身、模型背后的数学、还有围绕它的检索装置。第一卷用平实的话讲清楚 LLM 是什么。第二卷打开它底下的数学。第三卷走通了 RAG 在生产里的架构。第四卷讲的是另一件事:当你想让模型 动起来 — 调工具、跨轮保持状态、和别的智能体协作 — 它周围那一层东西怎么搭,才能不用每个季度都重写一遍胶水代码。

2025 年崩掉的那个模式,是单体智能体:一段长长的 system prompt、几个工具、一个上下文窗口被要求同时承担所有事。demo 时它能跑。生产里,prompt 越长、工具越多、模型每发一版就要重新适配一轮,这一套就开始绷不住。诊断从几个角度收敛到了同一个方向 — 上下文稀释、指令冲突、N 乘 M 的集成矩阵 — 指向同一个架构答案:在模型下面垫一层协议,让智能体能发现能力、协商会话、组合工具,两边事先都不需要认识对方。

这一层就是 Model Context Protocol。这本书一层一层老老实实地走它。承诺不是 MCP 能解决智能体的全部问题。承诺是,读完这本书,你会知道这个协议给了你什么、没给你什么,以及哪些建在它之上的模式真的能扛过生产环境。

一句话总结:智能体系统需要一层协议把模型和工具解耦,需要一套调度注意力和记忆的纪律,需要一种把服务器出处当回事的安全模型 — MCP 就是这三件事相遇的那一层。

这本书是写给谁的

写给在搭智能体系统的工程师、给它定范围的技术 PM、还有要在安全评审上为这些选择辩护的架构师。这本书假设读者熟悉第一卷里 LLM 怎么运作的那张图,也熟悉第三卷里检索怎么接进来的那张图;不假设读懂第二卷的数学。重心放在工程:故障在哪里、哪些决策能回头、哪些一签就要锁住团队好几年。

怎么读它

试读者反馈下来,三种读法都行得通。从头读到尾,如果你正要开始搭一个基于 MCP 的智能体系统,想按决策出现的顺序把协议过一遍。当参考手册读,如果你已经有一套跑着的系统,某一层正在疼 — 传输那一章、记忆那一章、安全那几章都可以独立站着。或者当架构评审的旁听材料读,这时章节变成团队在敲定部署拓扑之前应该走的那几场对话的提纲。

14 章的走法

3 月 30 日 — 第 1 章:AI 集成危机与智能体架构的兴起。单体智能体为什么会散,N 乘 M 的集成问题指什么,以及从 prompt 工程转向上下文工程这一步。

3 月 31 日 — 第 2 章:揭开 Model Context Protocol。MCP 到底标准化了什么,Host、Client、Server 三个角色各管什么,动态发现跟 REST 在哪些场景里不一样,以及从能力协商开始的会话生命周期。

4 月 1 日 — 第 3 章:服务器原语:暴露上下文与能力。Resources、Prompts、Tools — 服务器能给的三个名词,各自的 schema、生命周期,以及不把三者互相串台的纪律。

4 月 2 日 — 第 4 章:客户端原语:Sampling、Roots、Elicitation。反过来的那一面 — host 借给 server 的东西 — 以及每一项借出去都跨过了一条信任边界。

4 月 3 日 — 第 5 章:传输与发现。stdio 与 Streamable HTTP 各自该选哪一个,以及本地和远程部署里 server 跟 host 怎么找到彼此。

4 月 4 日 — 第 6 章:基础编排模式。智能体循环、工具路由、中间状态管理,以及那几个让智能体推理保持可读的模式。

4 月 5 日 — 第 7 章:高级编排模式。Planner-executor、多智能体协作、层级分解,以及每个模式分别在什么场景下值得它带来的那一份复杂度。

4 月 6 日 — 第 8 章:部署形态。严格的 MCP 纯净版、可复用 AI Agent、混合形态,各自给 host 带来什么权衡。

4 月 7 日 — 第 9 章:注意力预算。上下文当成一种要管的资源,长窗口的代价,以及决定每一轮模型看到什么的那些策略。

4 月 8 日 — 第 10 章:长时任务记忆。情景记忆与语义记忆,摘要策略,以及让智能体跨天保持状态的那种架构。

4 月 9 日 — 第 11 章:MCP 系统里的攻击面。威胁模型 — 资源里夹带的 prompt 注入、恶意 server、工具投毒、数据外泄路径。

4 月 10 日 — 第 12 章:协议加固。Server Card、同意 UI、能力裁剪,以及把策略放在该放的位置上的那一套操作控制。

4 月 11 日 — 第 13 章:框架与云。MCP 周围的生态 — 智能体框架、托管 server、注册表 — 以及怎么挑一个值得押注的底座。

4 月 12 日 — 第 14 章:智能体基准测试。什么指标真的重要,哪些会误导你,以及怎么搭一套换模型也不会塌的 eval 流水线。

第 IV 卷跟前面三卷有什么不一样:第一、二卷讲模型本身。第三卷讲围绕它的检索装置。这一卷讲认知层 — 协议、编排、记忆、安全,把模型变成一个能动手做事的东西。绝大多数智能体故障并不是模型出了问题。它们是上面一层做错的决定,prompt 工程再怎么修都救不回来。

关于这本书和这个系列

LLM Primer 系列是工程师、创始人、偶尔出现的监管者一遍遍问我同一个问题之后的长答案:这些系统到底是怎么运作的,要把一个扛得住负载的系统搭起来要花多少功夫?第一卷给了它的形状。第二卷给了它的数学。第三卷给了 RAG 在生产里的架构。第四卷给了模型上面那层认知。第五卷在写,讲端到端搭真实世界里的 LLM 应用。

想现在就看完整的全貌?LLM Primer IV: Designing AI Cognition with MCP 就是这一系列连载在走的那本书 — 协议参考、编排手册、安全清单、部署模板都在里面,这一系列只是把骨架画出来。在 Amazon 查看 LLM Primer IV →

明天见,第 1 章。

LLM Primer IV — 系列导读与目录

LLM Primer IV — 用 MCP 设计 AI 认知:系列导读与目录

这一卷为什么存在

这本书是写给谁的

怎么读它

14 章的走法

关于这本书和这个系列

下田昌平

LLM Primer IV — 用 MCP 设计 AI 认知:系列导读与目录

这一卷为什么存在

这本书是写给谁的

怎么读它

14 章的走法

关于这本书和这个系列

下田 昌平

下田昌平