LLM Primer IV — 系列导读与目录

发布于: 2026-03-29 最后更新于: 2026-06-12 版本: 1

LLM Primer IV — 用 MCP 设计 AI 认知:系列导读与目录

"一个智能体的上限,就是它能看到的上下文、能调到的工具、能记住的事情。"欢迎来到 LLM Primer 系列第四卷,以及配套的章节走读。接下来 14 天,每天一章,我们打开 Model Context Protocol 和它撑起的那一层认知架构,看哪些选择决定了一个智能体系统是悄悄跑得起来,还是悄悄垮掉。


这一卷为什么存在

IIIIII 卷分别给了你模型本身、模型背后的数学、还有围绕它的检索装置。第一卷用平实的话讲清楚 LLM 是什么。第二卷打开它底下的数学。第三卷走通了 RAG 在生产里的架构。第四卷讲的是另一件事:当你想让模型 动起来 — 调工具、跨轮保持状态、和别的智能体协作 — 它周围那一层东西怎么搭,才能不用每个季度都重写一遍胶水代码。

2025 年崩掉的那个模式,是单体智能体:一段长长的 system prompt、几个工具、一个上下文窗口被要求同时承担所有事。demo 时它能跑。生产里,prompt 越长、工具越多、模型每发一版就要重新适配一轮,这一套就开始绷不住。诊断从几个角度收敛到了同一个方向 — 上下文稀释、指令冲突、N 乘 M 的集成矩阵 — 指向同一个架构答案:在模型下面垫一层协议,让智能体能发现能力、协商会话、组合工具,两边事先都不需要认识对方。

这一层就是 Model Context Protocol。这本书一层一层老老实实地走它。承诺不是 MCP 能解决智能体的全部问题。承诺是,读完这本书,你会知道这个协议给了你什么、没给你什么,以及哪些建在它之上的模式真的能扛过生产环境。

一句话总结:智能体系统需要一层协议把模型和工具解耦,需要一套调度注意力和记忆的纪律,需要一种把服务器出处当回事的安全模型 — MCP 就是这三件事相遇的那一层。

这本书是写给谁的

写给在搭智能体系统的工程师、给它定范围的技术 PM、还有要在安全评审上为这些选择辩护的架构师。这本书假设读者熟悉第一卷里 LLM 怎么运作的那张图,也熟悉第三卷里检索怎么接进来的那张图;不假设读懂第二卷的数学。重心放在工程:故障在哪里、哪些决策能回头、哪些一签就要锁住团队好几年。

怎么读它

试读者反馈下来,三种读法都行得通。从头读到尾,如果你正要开始搭一个基于 MCP 的智能体系统,想按决策出现的顺序把协议过一遍。当参考手册读,如果你已经有一套跑着的系统,某一层正在疼 — 传输那一章、记忆那一章、安全那几章都可以独立站着。或者当架构评审的旁听材料读,这时章节变成团队在敲定部署拓扑之前应该走的那几场对话的提纲。

14 章的走法

3 月 30 日 — 第 1 章:AI 集成危机与智能体架构的兴起。单体智能体为什么会散,N 乘 M 的集成问题指什么,以及从 prompt 工程转向上下文工程这一步。

3 月 31 日 — 第 2 章:揭开 Model Context Protocol。MCP 到底标准化了什么,Host、Client、Server 三个角色各管什么,动态发现跟 REST 在哪些场景里不一样,以及从能力协商开始的会话生命周期。

4 月 1 日 — 第 3 章:服务器原语:暴露上下文与能力。Resources、Prompts、Tools — 服务器能给的三个名词,各自的 schema、生命周期,以及不把三者互相串台的纪律。

4 月 2 日 — 第 4 章:客户端原语:Sampling、Roots、Elicitation。反过来的那一面 — host 借给 server 的东西 — 以及每一项借出去都跨过了一条信任边界。

4 月 3 日 — 第 5 章:传输与发现。stdio 与 Streamable HTTP 各自该选哪一个,以及本地和远程部署里 server 跟 host 怎么找到彼此。

4 月 4 日 — 第 6 章:基础编排模式。智能体循环、工具路由、中间状态管理,以及那几个让智能体推理保持可读的模式。

4 月 5 日 — 第 7 章:高级编排模式。Planner-executor、多智能体协作、层级分解,以及每个模式分别在什么场景下值得它带来的那一份复杂度。

4 月 6 日 — 第 8 章:部署形态。严格的 MCP 纯净版、可复用 AI Agent、混合形态,各自给 host 带来什么权衡。

4 月 7 日 — 第 9 章:注意力预算。上下文当成一种要管的资源,长窗口的代价,以及决定每一轮模型看到什么的那些策略。

4 月 8 日 — 第 10 章:长时任务记忆。情景记忆与语义记忆,摘要策略,以及让智能体跨天保持状态的那种架构。

4 月 9 日 — 第 11 章:MCP 系统里的攻击面。威胁模型 — 资源里夹带的 prompt 注入、恶意 server、工具投毒、数据外泄路径。

4 月 10 日 — 第 12 章:协议加固。Server Card、同意 UI、能力裁剪,以及把策略放在该放的位置上的那一套操作控制。

4 月 11 日 — 第 13 章:框架与云。MCP 周围的生态 — 智能体框架、托管 server、注册表 — 以及怎么挑一个值得押注的底座。

4 月 12 日 — 第 14 章:智能体基准测试。什么指标真的重要,哪些会误导你,以及怎么搭一套换模型也不会塌的 eval 流水线。

第 IV 卷跟前面三卷有什么不一样:第一、二卷讲模型本身。第三卷讲围绕它的检索装置。这一卷讲认知层 — 协议、编排、记忆、安全,把模型变成一个能动手做事的东西。绝大多数智能体故障并不是模型出了问题。它们是上面一层做错的决定,prompt 工程再怎么修都救不回来。

关于这本书和这个系列

LLM Primer 系列是工程师、创始人、偶尔出现的监管者一遍遍问我同一个问题之后的长答案:这些系统到底是怎么运作的,要把一个扛得住负载的系统搭起来要花多少功夫?第一卷给了它的形状。第二卷给了它的数学。第三卷给了 RAG 在生产里的架构。第四卷给了模型上面那层认知。第五卷在写,讲端到端搭真实世界里的 LLM 应用。

想现在就看完整的全貌?LLM Primer IV: Designing AI Cognition with MCP 就是这一系列连载在走的那本书 — 协议参考、编排手册、安全清单、部署模板都在里面,这一系列只是把骨架画出来。在 Amazon 查看 LLM Primer IV →

明天见,第 1 章。


下田 昌平
下田 昌平
作为株式会社Receipt Roller的CEO兼CTO,目前负责开发电子收据服务以及自动将对话分类并生成行动任务的系统「ACTIONBRIDGE」。从小便接触编程,1996年参与开发测量仪器的相关程序,始终保持着对技术的深刻探索与热情。 在此前的职业生涯中,曾担任日本最大呼叫中心行业企业的子公司——一家研究开发公司的CEO/CTO,领导了多个技术开发项目。目前,我依然活跃在编程的最前沿,持续书写代码。