LLM Primer I — 章节走读:序言与目录

接下来十二篇会讲什么,以及怎么从里面拿到最多的东西 — 在你(也许会)真正翻开整本书之前。

这个连载是什么,又不是什么

先把一件事说清楚。明天开始的这十二篇,不是用来代替书的。它更像一张地图 — 走过每一章,指出书里在解决什么问题、中心想法是什么、为什么这块拼图在整幅画里重要。

如果你已经在日常工作里用 LLM,这个连载应该能帮你看出心里那张工作地图上哪几块还缺,值得补上。如果你刚开始,你会拿到一份词汇和直觉,看完之后再去读整本书会轻松很多。两种情况下目标是同一个:让这件事不再神秘,但不丢精度。

LLM Primer I 的章节顺序不是随意排的。前三章先把词汇和基本机制立起来 — LLM 是什么、文本怎么变成 token 和概率、Transformer 在内部怎么把这些东西推动起来。

第 4 章和第 5 章打开训练的引擎盖 — 预训练、微调、RLHF — 然后老老实实地看一眼:模型今天依然会在哪里摔跤?幻觉、对时间没概念、算术问题、一致性的抖动。

第 6 章进入整个连载里最细腻的地带:安全、对齐,以及"对用户真正有用"到底是什么意思。2026 版里新增了一节 §6.6,讲最新的对齐研究方向 — 宪法式 AI 和基于辩论的模型。

从第 7 章开始,焦点从"它怎么工作"切换到"怎么用它"。提示工程、工具调用与智能体(包括讲智能体模式的新 §8.6)、RAG、多模态,以及第 11 章 — 里面新增的 §11.6 整节讲推理模型。第 12 章合上整本书,带出系统视角,并为后面第 2 到第 7 卷搭起桥。

每一篇都给三样东西:这章在解决什么核心问题的简短复述、主要的几个概念动作(技术词汇会用普通话讲清楚)、以及通向下一章的过渡。每篇五到八分钟读完 — 是配早晨咖啡的体量,不是吃掉整个周末的体量。

如果有哪一篇真的勾住了你,书里对应的章节会走得深得多,还配有图、例子,以及把每一个技术想法用日常话再说一遍的"用大白话讲"侧边栏。

下面是十二篇的完整日程。每一篇都会准时上线,按顺序,不跳。如果你看到这页时某一篇还没出,后面的日期会告诉你它什么时候到。

2 月 18 日 — 第 1 章:所以,大语言模型究竟是什么?这个问题为什么没看上去那么显然,以及该尽早摆脱的三个误解。

2 月 19 日 — 第 2 章:概率、token 和文本。token 到底是什么、为什么模型每次给出的其实是整个概率分布而不是"一个答案"、以及 temperature 和 top-p 怎么改变输出的性格。

2 月 20 日 — 第 3 章:文本在模型里是怎么流动的。嵌入、注意力、Transformer 架构 — 不被矩阵淹没,也不丢精度。

2 月 21 日 — 第 4 章:模型是怎么学的。预训练、微调、RLHF — 以及每一段塑造的是什么。

2 月 22 日 — 第 5 章:它今天还在哪里磕绊。幻觉、时间、算术、一致性 — 为什么这些不是 bug,而是同一个机制的特性。

2 月 23 日 — 第 6 章:安全、对齐,以及"有用"到底是什么意思。包括新节 §6.6 讲宪法式 AI 和基于辩论的模型。

2 月 24 日 — 第 7 章:提示工程作为一门手艺。真正扛事的四个模式,以及它们为什么能行。

2 月 25 日 — 第 8 章:当一个模型不够 — 工具调用和智能体。加上新节 §8.6 讲智能体模式:ReAct、规划-执行、反思。

2 月 26 日 — 第 9 章:RAG — 怎么把新鲜信息缝进模型的上下文里。好 RAG 和坏 RAG 的分水岭。

2 月 27 日 — 第 10 章:多模态。同一个 Transformer 是怎么开始接收图像和音频的,以及它哪里还会迷路。

2 月 28 日 — 第 11 章:更小的模型,更聪明的模型。蒸馏、量化、MoE,以及讲推理模型的新节 §11.6。

3 月 1 日 — 第 12 章:搭一个 LLM 系统 — 以及之后呢。整本书的收尾,以及通向系列后续第 2–7 卷的桥。

想直接看完整的全貌? LLM Primer I: How Generative AI Works — 2026 版 — 就是这十二篇文章只在轻轻揭幕的那本书。在亚马逊上打开 →

明天,第 1 章见。