LLM Primer 系列

七卷本生成式 AI 现场指南,由下田昌平(Sho Shimoda)撰写,现已完结。从地基,到规模化,到安全。

这套系列在做什么

生成式 AI 现在已经无处不在,但围绕它写的内容,绝大多数都落在两个极端。一头是把它当作魔法来叙述的新闻标题。另一头是开篇第二段就要求你扛得起重量级数学的技术论文。这两者之间几乎没有人写,而每天要在真实业务里做决策的从业者,正好卡在这块夹缝里。

LLM Primer 系列想填的就是这块夹缝。整套系列一共七卷,现在已经全部出版完毕。每一卷都挑出 LLM 生态里的一个层面,把引擎盖打开,把里面是怎么转起来的讲清楚 — 讲到你第二天就能动手用的程度。不故弄玄虚,也不会在第二段就把线性代数课本甩在你面前。系列还有一部姊妹卷《Physical AI》,把同样的方法论从"用文字思考的模型"延伸到"要用身体在物理世界里做事的模型"。

作者是下田昌平 — 一个十几年里一直在生产环境里写代码、做架构、带团队的从业者。整套系列是他这十几年的工程经验,叠加这两年对生成式 AI 领域紧密追读的产物。

这套书是写给谁的:写给那些需要在 LLM 上做出靠谱判断、但没有机器学习博士学位的从业者。写给正在补上生成式 AI 这一面的软件工程师。写给想真正理解自己在向产品承诺什么的产品负责人。写给数据、安全、客服等相邻领域、感到脚下地基正在移动的技术人。写给受够了新闻标题、想自己亲眼把事情看清楚的好奇者。

怎么读这个页面

下面每一卷,都会列出完整的目录,按"部"组织。每一章都对应一篇章节走读文章,这些走读文章的链接直接列在章节标题里。要看每一卷完整的写作,请去 Amazon 上购买对应的书。

附录会列出来,作为透明性的一部分 — 但它们是书内专属内容:参考资料、备忘单、习题与解答,以及别的那些应该躺在书的后半部、而不是独立成走读文章的材料。要看附录,请读书。

七卷全景

第一卷 — 生成式 AI 是如何工作的

大语言模型基础的清晰实用指南。

整套系列那个用大白话铺的入口。从零开始 — token、训练、"猜下一个词"这件简单的事 — 一砖一瓦地搭出一幅老实、不堆术语的画面:LLM 到底是什么、它是怎么训练出来的、它为什么会有那些表现,完全不假定你之前懂任何东西。这是后面每一卷都踩着的地基。

现已在 Amazon 上架。 在 Amazon 查看 LLM Primer I →

章节走读序言: LLM Primer I — 章节走读:序言与目录

第一部 — 地基

第 1 章	所以,大语言模型究竟是什么?
第 2 章	概率、token 和文本
第 3 章	文本在模型里是怎么流动的

第二部 — 从模型到助手

第 4 章	模型是怎么学的
第 5 章	还是有些小毛病
第 6 章	安全、对齐,以及"有用"到底是什么意思

第三部 — 把它用起来

第 7 章	把提示工程当成一门手艺
第 8 章	当一个模型不够:工具调用与智能体
第 9 章	RAG:把新鲜信息缝进上下文

第四部 — 更远一点

第 10 章	多模态:走出文本
第 11 章	更小的模型,更聪明的模型
第 12 章	搭一个 LLM 系统,以及之后

附录 (书内专属)

附录 A	LLM 术语表
附录 B	注意力背后的数学
附录 C	Prompt 备忘单

附录 D	工具与库
附录 E	推荐阅读

第二卷 — 透过数学看语言模型

用数学的眼光,看清 AI 的内部运作。

对 AI 内部运作的一次数学严谨、又可读的巡视:注意力、优化的动力学、损失地形、扩展规律 — 全部透过那套让它真的能跑起来的数学讲清楚。每一条要紧的方程都被完整推导,每一条又都被一个故事、一个类比、一个数值化的算例围起来。写给那些想看到第一卷有意留在侧边栏里的数学的读者。

现已在 Amazon 上架。 在 Amazon 查看 LLM Primer II →

章节走读序言: LLM Primer II — 章节走读:序言与目录

第一部 — 几何与基础

第 1 章	语言模型的数学直觉
第 2 章	把 LLM 放进上下文
第 3 章	数学工具

第二部 — 模型的内部构造

第 4 章	注意力
第 5 章	位置、顺序与序列结构
第 6 章	Transformer 块
第 7 章	效率与 Transformer 变体

第三部 — 训练、对齐与衡量

第 8 章	模型是怎么学的
第 9 章	在规模上做训练
第 10 章	后训练与对齐的数学
第 11 章	评估、校准与推理

第四部 — LLM 的世界面

第 12 章	LLM 的现实世界应用
第 13 章	局限、风险与未解的挑战
第 14 章	工程师的实用知识

附录 (书内专属)

附录 A	LLM 数学备忘单
附录 B	关于 LLM 的统计学视角
附录 C	读者最常问的那些问题
附录 D	关键推导手算

附录 E	习题与解答
附录 F	符号索引
附录 G	一次完整的前向传播,数字版
附录 H	那些想法的时间线

第三卷 — 用 RAG 强化企业 AI

面向企业的检索增强生成系统实战指南。

实战的检索增强生成 — 向量数据库、切分策略,以及"把模型钉在你自己文档上"的那一整套架构,让企业能拿到既最新又能交代来源的回答。如果你的工作是让 AI 功能跟上业务、跟得住引用,这就是该读的那一卷。

现已在 Amazon 上架。 在 Amazon 查看 LLM Primer III →

章节走读序言: LLM Primer III 章节解读 — 系列导言与目录

第一部 — RAG 架构基础

第 1 章

RAG 架构的演进

第二部 — 数据摄取、解析与切分

第 2 章	智能文档解析
第 3 章	进阶切分框架

第三部 — 向量数据库与检索优化

第 4 章	选对向量数据库
第 5 章	搭起检索流水线

第四部 — 安全、隐私与访问控制

第 6 章	RAG 的威胁模型与漏洞
第 7 章	实施访问控制
第 8 章	RAG 流水线里的数据脱敏

第五部 — 评估、监控与维护

第 9 章	RAG 评估三角
第 10 章	主流评估框架
第 11 章	持续更新与流水线优化

附录 (书内专属)

附录 A	RAG 优化的关键数学公式
附录 B	数据脱敏与评估的样例系统提示

附录 C	向量数据库与工具的选型矩阵
附录 D	RAG 评估的基准数据集

第四卷 — 用 MCP 设计 AI 的认知

为可靠的 AI 智能体设计上下文、工具与记忆。

结构化上下文建模与编排:不去改模型本身,而是通过设计模型"看到"的上下文与情境,塑造它的推理过程。如果你在搭智能体系统 — 工具清单、长期循环、跨会话的记忆,以及"决定模型能看到什么"的那门工程纪律 — 这就是该读的那一卷。

现已在 Amazon 上架。 在 Amazon 查看 LLM Primer IV →

章节走读序言: LLM Primer IV 章节解读 — 系列导言与目录

第一部 — AI 整合的范式转换

第 1 章	AI 整合危机与智能体架构的兴起
第 2 章	揭开模型上下文协议 (MCP) 的面纱

第二部 — MCP 的核心机制

第 3 章	服务端原语 — 暴露上下文与能力
第 4 章	客户端原语 — 智能体行为与控制
第 5 章	传输协议与发现

第三部 — 多智能体编排模式

第 6 章	基本编排策略
第 7 章	高级协作与动态模式
第 8 章	架构部署版图

第四部 — 设计 AI 的认知:上下文与记忆

第 9 章	管理注意力预算
第 10 章	长周期任务记忆

第五部 — 保护智能体工作流

第 11 章	攻击面与协议漏洞
第 12 章	协议加固与防御

第六部 — 生产工程与规模

第 13 章	框架与云集成
第 14 章	基准、测试与性能

附录 (书内专属)

附录 A	MCP 速查与备忘单
附录 B	实施蓝图与代码示例
附录 C	生产就绪与安全清单

附录 D	进阶规范与标准增强提案 (SEP)
附录 E	基准与性能数据
附录 F	官方资源与生态链接

第五卷 — 构建真实世界的 LLM 应用

在生产中设计、评估和运营 LLM 系统。

一卷以"系统"视角写的、从原型走到生产的指南 — API 设计、评估循环、监控、集成 — 把一个有能力的模型,变成一个真正可靠的产品。这卷是把"架构上的理解"变成"上线之后能真接住用户"的那一卷。

现已在 Amazon 上架。 在 Amazon 查看 LLM Primer V →

章节走读序言: LLM Primer V — 章节走读:序言与目录

第一部 — AI 工程基础

第 1 章	AI 工程这门学科
第 2 章	基础模型与提示工程

第二部 — 构建智能体与检索能力

第 3 章	检索增强生成 (RAG)
第 4 章	AI 智能体与工具调用

第三部 — 质量保证与可观测性

第 5 章	评估 LLM 应用
第 6 章	AI 可观测性与追踪

第四部 — 安全、规模与优化

第 7 章	LLM 安全与护栏
第 8 章	优化性能、服务与成本

附录 (书内专属)

附录 A	生产就绪与安全清单
附录 B	工具与框架选型矩阵
附录 C	协议、流式输出与结构化输出

附录 D	速率限制与成本管理的架构
附录 E	AI 工程指标与术语表

第六卷 — 让 AI 系统跑得起规模

面向生产规模的低延迟 LLM 推理架构。

高性能推理的架构:分布式服务、延迟优化、为"一天得回答几百万次"的系统所做的成本建模。当你的 AI 系统已经长出一台机器、开始要像一块真正的基础设施那样工作时,这就是该读的那一卷。

现已在 Amazon 上架。 在 Amazon 查看 LLM Primer VI →

章节走读序言: LLM Primer VI — 章节走读:序言与目录

第一部 — LLM 推理的基础

第 1 章	token 生成的机制
第 2 章	KV 缓存这道题

第二部 — 硬件底座

第 3 章	数据中心 GPU 与生成式 AI
第 4 章	专用 AI 硅片与 ASIC

第三部 — 模型层面的优化(压缩)

第 5 章	把量化讲明白
第 6 章	剪枝与知识蒸馏

第四部 — 系统与引擎层面的优化

第 7 章	进阶批处理策略
第 8 章	下一代 KV 缓存管理
第 9 章	投机解码

第五部 — 服务框架与编排

第 10 章	LLM 引擎层
第 11 章	平台层与编排层
第 12 章	解耦式服务与 Kubernetes
第 13 章	自动扩缩与冷启动缓解

第六部 — 应用层经济学与 TCO

第 14 章	Token 经济学与 API 定价
第 15 章	无服务器 API 与专用基础设施
第 16 章	生产中的降本策略

附录 (书内专属)

附录 A	数学公式与成本建模参考
附录 B	硬件与加速器规格指南

附录 C	部署配置与代码片段
附录 D	基准测试方法与指标定义

第七卷 — AI 安全

抵御提示注入、越狱与对抗性威胁,守住 LLM 系统。

设计安全且鲁棒的 AI:对抗性风险、提示注入、治理框架,以及现实部署系统的防御性设计。当你的 AI 系统必须被当作"安全相关的基础设施"对待时,这就是该读的那一卷。

现已在 Amazon 上架。 在 Amazon 查看 LLM Primer VII →

章节走读序言: LLM Primer VII — 章节走读:序言与目录

第一部 — AI 安全基础

第 1 章	为什么 AI 安全不一样
第 2 章	LLM 系统的威胁建模
第 3 章	数据安全与隐私

第二部 — 提示与交互的安全

第 4 章	提示注入与越狱
第 5 章	输入校验与输出过滤
第 6 章	检索增强生成的风险

第三部 — 模型鲁棒性与可靠性

第 7 章	幻觉与可靠性
第 8 章	对模型的对抗攻击
第 9 章	模型完整性与供应链风险

第四部 — 系统级安全架构

第 10 章	设计安全的 LLM 架构
第 11 章	可观测性、日志与事件响应
第 12 章	访问控制与身份

第五部 — 治理、伦理与合规

第 13 章	监管全景
第 14 章	偏见、公平与负责任的 AI
第 15 章	建立一个安全的 AI 组织

第六部 — 进阶话题

第 16 章	安全的微调与适配
第 17 章	未来的威胁与新兴的防御

附录 (书内专属)

附录 A	生产系统的 AI 安全清单
附录 B	威胁模型样例模板
附录 C	安全提示的设计模式

附录 D	LLM 应用的事件响应模板
附录 E	推荐工具与框架

Physical AI — 一部姊妹卷

七卷 LLM Primer 讲的是"用文字思考的模型"。但同样一套底层技术,一旦落到需要用身体在物理世界里做事的机器上 — 机器人手臂、自动驾驶、无人机、具身智能 — 一切都会变。感知、规划、控制、安全,都得重新写一遍。

《Physical AI》是这套系列的姊妹卷,把 LLM Primer 的方法论延伸到那一整块领域。它不是本系列的第八卷,而是从旁边平行地展开:一样的"打开引擎盖看清楚里面在转什么"的写法,但主角换成了要在现实世界里做出动作的智能体。如果你在做机器人、自动化、具身 AI,或者关心 LLM 之外那个"AI 走出屏幕"的方向,那本书就是写给你的。

先从第一卷开始。十二章,从零讲清楚 LLM 这个东西到底是什么。在 Amazon 查看 LLM Primer I →

然后一卷一卷往下读。七本书连成一条从"这是什么"到"怎么把它安全地跑在生产里"的完整弧线。