LLM Primer 系列 — 一卷一卷读懂生成式 AI 的实战指南

发布于: 2026-02-15 最后更新于: 2026-06-06 版本: 4
LLM Primer 系列 — 一卷一卷读懂生成式 AI 的实战指南

LLM Primer 系列

七卷书,一条路 — 由下田昌平写给那些真正要用 LLM、而不只是谈论它的从业者。从地基,到规模化,到安全。


这套系列在做什么

生成式 AI 现在到处都是,但围绕它写的内容,绝大部分都落在两个极端。一头是把它当魔法的新闻标题。另一头是开篇第二段就要求你扛得起重量级数学的技术论文。这两者之间几乎没人写,而真正每天要做真实决策的从业者,正好困在这块夹缝里。

LLM Primer 系列就是想填上这块夹缝。每一本书都挑出 LLM 生态里的一块,把引擎盖打开,然后把里面是怎么转的,讲到你第二天就能动手用的程度。不故弄玄虚,也不要你在第二段就翻开线性代数课本。

作者是下田昌平 — 一个十几年里一直在生产环境里写代码、做架构、带团队的从业者。整套系列是他这十几年的工程感和这两年的领域追读叠在一起的结果。

这套书是写给谁的:写给那些需要在 LLM 上做出靠谱判断、但没有机器学习博士学位的从业者。写给正在补上生成式这一面的工程师。写给想真正理解自己在向产品承诺什么的产品负责人。写给数据、安全、客服等相邻领域、感到脚下地基开始挪动的技术人。写给那些受够了新闻标题、想自己亲眼看清楚的好奇之人。

怎么读这个页面

下面每一卷,我都会列出完整的目录,按"部"组织。系列每一章我们都会出一篇章节走读文章。已经写好走读的章节会带链接;尚未写走读的章节先以纯文本列出。

附录会列出来,作为透明性的一部分 — 但它们是 书内专属内容:参考资料、备忘单、习题与解答,以及别的那些应该躺在书的后半部、而不是独立成走读文章的材料。要看附录,请读书。


第一卷 — 生成式 AI 是如何工作的

大语言模型基础的清晰实用指南。

整套系列那个用大白话铺的入口。从零开始 — token、训练、"猜下一个词"这件简单的事 — 一砖一瓦地搭出一幅老实、不堆术语的画面:LLM 到底是什么、它是怎么训练出来的、它为什么有那些表现,完全不假定你之前懂任何东西。这是后面每一卷都踩着的地基。

在亚马逊查看《LLM Primer I》→

LLM Primer I 封面

章节走读序言: LLM Primer I — 章节走读:序言与目录

附录 (书内专属)

附录 ALLM 术语表
附录 B注意力背后的数学
附录 CPrompt 备忘单
附录 D工具与库
附录 E推荐阅读

第二卷 — 透过数学看语言模型

用数学的眼光,看清 AI 的内部运作。

对 AI 内部运作的一次数学严谨、又可读的巡视:注意力、优化的动力学、损失地形、扩展规律 — 全部透过那套让它真的能跑起来的数学讲清楚。每一条要紧的方程都被完整推导,每一条又都被一个故事、一个类比、一个数值化的算例围起来。写给那些想看到第一卷有意留在侧边栏里的数学的读者。

在亚马逊查看《LLM Primer II》→

LLM Primer II 封面

章节走读序言: LLM Primer II — 章节走读:序言与目录

第一部 — 几何与基础

第 1 章语言模型的数学直觉
第 2 章把 LLM 放进上下文
第 3 章数学工具

第二部 — 模型的内部构造

第 4 章注意力
第 5 章位置、顺序与序列结构
第 6 章Transformer 块
第 7 章效率与 Transformer 变体

第三部 — 训练、对齐与衡量

第 8 章模型是怎么学的
第 9 章在规模上做训练
第 10 章后训练与对齐的数学
第 11 章评估、校准与推理

第四部 — LLM 的世界面

第 12 章LLM 的现实世界应用
第 13 章局限、风险与未解的挑战
第 14 章工程师的实用知识

附录 (书内专属)

附录 ALLM 数学备忘单
附录 B关于 LLM 的统计学视角
附录 C读者最常问的那些问题
附录 D关键推导手算
附录 E习题与解答
附录 F符号索引
附录 G一次完整的前向传播,数字版
附录 H那些想法的时间线

第三卷 — 用 RAG 强化企业 AI

面向企业的检索增强生成系统实战指南。

实战的检索增强生成 — 向量数据库、切分策略,以及"把模型钉在你自己文档上"的那一整套架构,让企业能拿到既最新又能交代来源的回答。如果你的工作是让 AI 功能跟上业务、跟得住引用,这就是该读的那一卷。

LLM Primer III 封面

第一部 — RAG 架构基础

第 1 章RAG 架构的演进

第二部 — 数据摄取、解析与切分

第 2 章智能文档解析
第 3 章进阶切分框架

第三部 — 向量数据库与检索优化

第 4 章选对向量数据库
第 5 章搭起检索流水线

第四部 — 安全、隐私与访问控制

第 6 章RAG 的威胁模型与漏洞
第 7 章实施访问控制
第 8 章RAG 流水线里的数据脱敏

第五部 — 评估、监控与维护

第 9 章RAG 评估三角
第 10 章主流评估框架
第 11 章持续更新与流水线优化

附录 (书内专属)

附录 ARAG 优化的关键数学公式
附录 B数据脱敏与评估的样例系统提示
附录 C向量数据库与工具的选型矩阵
附录 DRAG 评估的基准数据集

第四卷 — 用 MCP 设计 AI 的认知

为可靠的 AI 智能体设计上下文、工具与记忆。

结构化上下文建模与编排:不去改模型本身,而是通过设计模型"看到"的上下文与情境,塑造它的推理过程。如果你在搭智能体系统 — 工具清单、长期循环、跨会话的记忆,以及"决定模型能看到什么"的那门工程纪律 — 这就是该读的那一卷。

LLM Primer IV 封面

第一部 — AI 整合的范式转换

第 1 章AI 整合危机与智能体架构的兴起
第 2 章揭开模型上下文协议 (MCP) 的面纱

第二部 — MCP 的核心机制

第 3 章服务端原语 — 暴露上下文与能力
第 4 章客户端原语 — 智能体行为与控制
第 5 章传输协议与发现

第三部 — 多智能体编排模式

第 6 章基本编排策略
第 7 章高级协作与动态模式
第 8 章架构部署版图

第四部 — 设计 AI 的认知:上下文与记忆

第 9 章管理注意力预算
第 10 章长周期任务记忆

第五部 — 保护智能体工作流

第 11 章攻击面与协议漏洞
第 12 章协议加固与防御

第六部 — 生产工程与规模

第 13 章框架与云集成
第 14 章基准、测试与性能

附录 (书内专属)

附录 AMCP 速查与备忘单
附录 B实施蓝图与代码示例
附录 C生产就绪与安全清单
附录 D进阶规范与标准增强提案 (SEP)
附录 E基准与性能数据
附录 F官方资源与生态链接

第五卷 — 构建真实世界的 LLM 应用

在生产中设计、评估和运营 LLM 系统。

一卷以"系统"视角写的、从原型走到生产的指南 — API 设计、评估循环、监控、集成 — 把一个有能力的模型,变成一个真正可靠的产品。这卷是把"架构上的理解"变成"上线之后能真接住用户"的那一卷。

LLM Primer V 封面

第一部 — AI 工程基础

第 1 章AI 工程这门学科
第 2 章基础模型与提示工程

第二部 — 构建智能体与检索能力

第 3 章检索增强生成 (RAG)
第 4 章AI 智能体与工具调用

第三部 — 质量保证与可观测性

第 5 章评估 LLM 应用
第 6 章AI 可观测性与追踪

第四部 — 安全、规模与优化

第 7 章LLM 安全与护栏
第 8 章优化性能、服务与成本

附录 (书内专属)

附录 A生产就绪与安全清单
附录 B工具与框架选型矩阵
附录 C协议、流式输出与结构化输出
附录 D速率限制与成本管理的架构
附录 EAI 工程指标与术语表

第六卷 — 让 AI 系统跑得起规模

面向生产规模的低延迟 LLM 推理架构。

高性能推理的架构:分布式服务、延迟优化、为"一天得回答几百万次"的系统所做的成本建模。当你的 AI 系统已经长出一台机器、开始要像一块真正的基础设施那样工作时,这就是该读的那一卷。

LLM Primer VI 封面

第一部 — LLM 推理的基础

第 1 章token 生成的机制
第 2 章KV 缓存这道题

第二部 — 硬件底座

第 3 章数据中心 GPU 与生成式 AI
第 4 章专用 AI 硅片与 ASIC

第三部 — 模型层面的优化(压缩)

第 5 章把量化讲明白
第 6 章剪枝与知识蒸馏

第四部 — 系统与引擎层面的优化

第 7 章进阶批处理策略
第 8 章下一代 KV 缓存管理
第 9 章投机解码

第五部 — 服务框架与编排

第 10 章LLM 引擎层
第 11 章平台层与编排层
第 12 章解耦式服务与 Kubernetes
第 13 章自动扩缩与冷启动缓解

第六部 — 应用层经济学与 TCO

第 14 章Token 经济学与 API 定价
第 15 章无服务器 API 与专用基础设施
第 16 章生产中的降本策略

附录 (书内专属)

附录 A数学公式与成本建模参考
附录 B硬件与加速器规格指南
附录 C部署配置与代码片段
附录 D基准测试方法与指标定义

第七卷 — AI 安全

抵御提示注入、越狱与对抗性威胁,守住 LLM 系统。

设计安全且鲁棒的 AI:对抗性风险、提示注入、治理框架,以及现实部署系统的防御性设计。当你的 AI 系统必须被当作"安全相关的基础设施"对待时,这就是该读的那一卷。

LLM Primer VII 封面

第一部 — AI 安全基础

第 1 章为什么 AI 安全不一样
第 2 章LLM 系统的威胁建模
第 3 章数据安全与隐私

第二部 — 提示与交互的安全

第 4 章提示注入与越狱
第 5 章输入校验与输出过滤
第 6 章检索增强生成的风险

第三部 — 模型鲁棒性与可靠性

第 7 章幻觉与可靠性
第 8 章对模型的对抗攻击
第 9 章模型完整性与供应链风险

第四部 — 系统级安全架构

第 10 章设计安全的 LLM 架构
第 11 章可观测性、日志与事件响应
第 12 章访问控制与身份

第五部 — 治理、伦理与合规

第 13 章监管全景
第 14 章偏见、公平与负责任的 AI
第 15 章建立一个安全的 AI 组织

第六部 — 进阶话题

第 16 章安全的微调与适配
第 17 章未来的威胁与新兴的防御

附录 (书内专属)

附录 A生产系统的 AI 安全清单
附录 B威胁模型样例模板
附录 C安全提示的设计模式
附录 DLLM 应用的事件响应模板
附录 E推荐工具与框架

这个页面会怎么生长

这个页面会随着系列每一卷的出版、以及每一章走读文章的上线,不断更新。第三卷到第七卷的完整目录都已经在上面了;这些章节的走读文章,会在写好之后慢慢补上。

如果你想跟着这套系列一卷一卷往下读,把这个页面收藏起来,或者订阅这个频道的更新 — 每一篇新文章上线那天,你就会收到。


先从第一卷开始。十二章,从零讲清楚 LLM 这个东西到底是什么。在亚马逊查看《LLM Primer I》→
然后用第二卷往深里走。把第一卷里那些机械底下的数学,一条一条讲透。在亚马逊查看《LLM Primer II》→

下田 昌平
下田 昌平
作为株式会社Receipt Roller的CEO兼CTO,目前负责开发电子收据服务以及自动将对话分类并生成行动任务的系统「ACTIONBRIDGE」。从小便接触编程,1996年参与开发测量仪器的相关程序,始终保持着对技术的深刻探索与热情。 在此前的职业生涯中,曾担任日本最大呼叫中心行业企业的子公司——一家研究开发公司的CEO/CTO,领导了多个技术开发项目。目前,我依然活跃在编程的最前沿,持续书写代码。