LLM Primer 系列
七卷书,一条路 — 由下田昌平写给那些真正要用 LLM、而不只是谈论它的从业者。从地基,到规模化,到安全。
这套系列在做什么
生成式 AI 现在到处都是,但围绕它写的内容,绝大部分都落在两个极端。一头是把它当魔法的新闻标题。另一头是开篇第二段就要求你扛得起重量级数学的技术论文。这两者之间几乎没人写,而真正每天要做真实决策的从业者,正好困在这块夹缝里。
LLM Primer 系列就是想填上这块夹缝。每一本书都挑出 LLM 生态里的一块,把引擎盖打开,然后把里面是怎么转的,讲到你第二天就能动手用的程度。不故弄玄虚,也不要你在第二段就翻开线性代数课本。
作者是下田昌平 — 一个十几年里一直在生产环境里写代码、做架构、带团队的从业者。整套系列是他这十几年的工程感和这两年的领域追读叠在一起的结果。
这套书是写给谁的:写给那些需要在 LLM 上做出靠谱判断、但没有机器学习博士学位的从业者。写给正在补上生成式这一面的工程师。写给想真正理解自己在向产品承诺什么的产品负责人。写给数据、安全、客服等相邻领域、感到脚下地基开始挪动的技术人。写给那些受够了新闻标题、想自己亲眼看清楚的好奇之人。
怎么读这个页面
下面每一卷,我都会列出完整的目录,按"部"组织。系列每一章我们都会出一篇章节走读文章。已经写好走读的章节会带链接;尚未写走读的章节先以纯文本列出。
附录会列出来,作为透明性的一部分 — 但它们是 书内专属内容:参考资料、备忘单、习题与解答,以及别的那些应该躺在书的后半部、而不是独立成走读文章的材料。要看附录,请读书。
第一卷 — 生成式 AI 是如何工作的
大语言模型基础的清晰实用指南。
整套系列那个用大白话铺的入口。从零开始 — token、训练、"猜下一个词"这件简单的事 — 一砖一瓦地搭出一幅老实、不堆术语的画面:LLM 到底是什么、它是怎么训练出来的、它为什么有那些表现,完全不假定你之前懂任何东西。这是后面每一卷都踩着的地基。
在亚马逊查看《LLM Primer I》→
|
|
章节走读序言: LLM Primer I — 章节走读:序言与目录
附录 (书内专属)
| 附录 A | LLM 术语表 |
| 附录 B | 注意力背后的数学 |
| 附录 C | Prompt 备忘单 |
第二卷 — 透过数学看语言模型
用数学的眼光,看清 AI 的内部运作。
对 AI 内部运作的一次数学严谨、又可读的巡视:注意力、优化的动力学、损失地形、扩展规律 — 全部透过那套让它真的能跑起来的数学讲清楚。每一条要紧的方程都被完整推导,每一条又都被一个故事、一个类比、一个数值化的算例围起来。写给那些想看到第一卷有意留在侧边栏里的数学的读者。
在亚马逊查看《LLM Primer II》→
|
|
章节走读序言: LLM Primer II — 章节走读:序言与目录
附录 (书内专属)
| 附录 A | LLM 数学备忘单 |
| 附录 B | 关于 LLM 的统计学视角 |
| 附录 C | 读者最常问的那些问题 |
| 附录 D | 关键推导手算 |
| 附录 E | 习题与解答 |
| 附录 F | 符号索引 |
| 附录 G | 一次完整的前向传播,数字版 |
| 附录 H | 那些想法的时间线 |
第三卷 — 用 RAG 强化企业 AI
面向企业的检索增强生成系统实战指南。
实战的检索增强生成 — 向量数据库、切分策略,以及"把模型钉在你自己文档上"的那一整套架构,让企业能拿到既最新又能交代来源的回答。如果你的工作是让 AI 功能跟上业务、跟得住引用,这就是该读的那一卷。
|
|
第一部 — RAG 架构基础
第二部 — 数据摄取、解析与切分
第三部 — 向量数据库与检索优化
| 第 4 章 | 选对向量数据库 |
| 第 5 章 | 搭起检索流水线 |
第四部 — 安全、隐私与访问控制
| 第 6 章 | RAG 的威胁模型与漏洞 |
| 第 7 章 | 实施访问控制 |
| 第 8 章 | RAG 流水线里的数据脱敏 |
第五部 — 评估、监控与维护
| 第 9 章 | RAG 评估三角 |
| 第 10 章 | 主流评估框架 |
| 第 11 章 | 持续更新与流水线优化 |
附录 (书内专属)
| 附录 A | RAG 优化的关键数学公式 |
| 附录 B | 数据脱敏与评估的样例系统提示 |
| 附录 C | 向量数据库与工具的选型矩阵 |
| 附录 D | RAG 评估的基准数据集 |
第四卷 — 用 MCP 设计 AI 的认知
为可靠的 AI 智能体设计上下文、工具与记忆。
结构化上下文建模与编排:不去改模型本身,而是通过设计模型"看到"的上下文与情境,塑造它的推理过程。如果你在搭智能体系统 — 工具清单、长期循环、跨会话的记忆,以及"决定模型能看到什么"的那门工程纪律 — 这就是该读的那一卷。
|
|
第一部 — AI 整合的范式转换
| 第 1 章 | AI 整合危机与智能体架构的兴起 |
| 第 2 章 | 揭开模型上下文协议 (MCP) 的面纱 |
第二部 — MCP 的核心机制
| 第 3 章 | 服务端原语 — 暴露上下文与能力 |
| 第 4 章 | 客户端原语 — 智能体行为与控制 |
| 第 5 章 | 传输协议与发现 |
第三部 — 多智能体编排模式
| 第 6 章 | 基本编排策略 |
| 第 7 章 | 高级协作与动态模式 |
| 第 8 章 | 架构部署版图 |
第四部 — 设计 AI 的认知:上下文与记忆
| 第 9 章 | 管理注意力预算 |
| 第 10 章 | 长周期任务记忆 |
第五部 — 保护智能体工作流
| 第 11 章 | 攻击面与协议漏洞 |
| 第 12 章 | 协议加固与防御 |
第六部 — 生产工程与规模
| 第 13 章 | 框架与云集成 |
| 第 14 章 | 基准、测试与性能 |
附录 (书内专属)
| 附录 A | MCP 速查与备忘单 |
| 附录 B | 实施蓝图与代码示例 |
| 附录 C | 生产就绪与安全清单 |
| 附录 D | 进阶规范与标准增强提案 (SEP) |
| 附录 E | 基准与性能数据 |
| 附录 F | 官方资源与生态链接 |
第五卷 — 构建真实世界的 LLM 应用
在生产中设计、评估和运营 LLM 系统。
一卷以"系统"视角写的、从原型走到生产的指南 — API 设计、评估循环、监控、集成 — 把一个有能力的模型,变成一个真正可靠的产品。这卷是把"架构上的理解"变成"上线之后能真接住用户"的那一卷。
|
|
第一部 — AI 工程基础
| 第 1 章 | AI 工程这门学科 |
| 第 2 章 | 基础模型与提示工程 |
第二部 — 构建智能体与检索能力
| 第 3 章 | 检索增强生成 (RAG) |
| 第 4 章 | AI 智能体与工具调用 |
第三部 — 质量保证与可观测性
| 第 5 章 | 评估 LLM 应用 |
| 第 6 章 | AI 可观测性与追踪 |
第四部 — 安全、规模与优化
| 第 7 章 | LLM 安全与护栏 |
| 第 8 章 | 优化性能、服务与成本 |
附录 (书内专属)
| 附录 A | 生产就绪与安全清单 |
| 附录 B | 工具与框架选型矩阵 |
| 附录 C | 协议、流式输出与结构化输出 |
| 附录 D | 速率限制与成本管理的架构 |
| 附录 E | AI 工程指标与术语表 |
第六卷 — 让 AI 系统跑得起规模
面向生产规模的低延迟 LLM 推理架构。
高性能推理的架构:分布式服务、延迟优化、为"一天得回答几百万次"的系统所做的成本建模。当你的 AI 系统已经长出一台机器、开始要像一块真正的基础设施那样工作时,这就是该读的那一卷。
|
|
第一部 — LLM 推理的基础
| 第 1 章 | token 生成的机制 |
| 第 2 章 | KV 缓存这道题 |
第二部 — 硬件底座
| 第 3 章 | 数据中心 GPU 与生成式 AI |
| 第 4 章 | 专用 AI 硅片与 ASIC |
第三部 — 模型层面的优化(压缩)
第四部 — 系统与引擎层面的优化
| 第 7 章 | 进阶批处理策略 |
| 第 8 章 | 下一代 KV 缓存管理 |
| 第 9 章 | 投机解码 |
第五部 — 服务框架与编排
| 第 10 章 | LLM 引擎层 |
| 第 11 章 | 平台层与编排层 |
| 第 12 章 | 解耦式服务与 Kubernetes |
| 第 13 章 | 自动扩缩与冷启动缓解 |
第六部 — 应用层经济学与 TCO
| 第 14 章 | Token 经济学与 API 定价 |
| 第 15 章 | 无服务器 API 与专用基础设施 |
| 第 16 章 | 生产中的降本策略 |
附录 (书内专属)
| 附录 A | 数学公式与成本建模参考 |
| 附录 B | 硬件与加速器规格指南 |
| 附录 C | 部署配置与代码片段 |
| 附录 D | 基准测试方法与指标定义 |
第七卷 — AI 安全
抵御提示注入、越狱与对抗性威胁,守住 LLM 系统。
设计安全且鲁棒的 AI:对抗性风险、提示注入、治理框架,以及现实部署系统的防御性设计。当你的 AI 系统必须被当作"安全相关的基础设施"对待时,这就是该读的那一卷。
|
|
第一部 — AI 安全基础
| 第 1 章 | 为什么 AI 安全不一样 |
| 第 2 章 | LLM 系统的威胁建模 |
| 第 3 章 | 数据安全与隐私 |
第二部 — 提示与交互的安全
| 第 4 章 | 提示注入与越狱 |
| 第 5 章 | 输入校验与输出过滤 |
| 第 6 章 | 检索增强生成的风险 |
第三部 — 模型鲁棒性与可靠性
| 第 7 章 | 幻觉与可靠性 |
| 第 8 章 | 对模型的对抗攻击 |
| 第 9 章 | 模型完整性与供应链风险 |
第四部 — 系统级安全架构
| 第 10 章 | 设计安全的 LLM 架构 |
| 第 11 章 | 可观测性、日志与事件响应 |
| 第 12 章 | 访问控制与身份 |
第五部 — 治理、伦理与合规
| 第 13 章 | 监管全景 |
| 第 14 章 | 偏见、公平与负责任的 AI |
| 第 15 章 | 建立一个安全的 AI 组织 |
第六部 — 进阶话题
| 第 16 章 | 安全的微调与适配 |
| 第 17 章 | 未来的威胁与新兴的防御 |
附录 (书内专属)
| 附录 A | 生产系统的 AI 安全清单 |
| 附录 B | 威胁模型样例模板 |
| 附录 C | 安全提示的设计模式 |
| 附录 D | LLM 应用的事件响应模板 |
| 附录 E | 推荐工具与框架 |
这个页面会怎么生长
这个页面会随着系列每一卷的出版、以及每一章走读文章的上线,不断更新。第三卷到第七卷的完整目录都已经在上面了;这些章节的走读文章,会在写好之后慢慢补上。
如果你想跟着这套系列一卷一卷往下读,把这个页面收藏起来,或者订阅这个频道的更新 — 每一篇新文章上线那天,你就会收到。