LLM Primer I — 章节走读:序言与目录

发布于: 2026-02-17 最后更新于: 2026-06-05 版本: 1

LLM Primer I — 章节走读:序言与目录

接下来十二篇会讲什么,以及怎么从里面拿到最多的东西 — 在你(也许会)真正翻开整本书之前。


这个连载是什么,又不是什么

先把一件事说清楚。明天开始的这十二篇,不是用来代替书的。它更像一张地图 — 走过每一章,指出书里在解决什么问题、中心想法是什么、为什么这块拼图在整幅画里重要。

如果你已经在日常工作里用 LLM,这个连载应该能帮你看出心里那张工作地图上哪几块还缺,值得补上。如果你刚开始,你会拿到一份词汇和直觉,看完之后再去读整本书会轻松很多。两种情况下目标是同一个:让这件事不再神秘,但不丢精度。

第一卷是怎么搭起来的

LLM Primer I 的章节顺序不是随意排的。前三章先把词汇和基本机制立起来 — LLM 是什么、文本怎么变成 token 和概率、Transformer 在内部怎么把这些东西推动起来。

第 4 章和第 5 章打开训练的引擎盖 — 预训练、微调、RLHF — 然后老老实实地看一眼:模型今天依然会在哪里摔跤?幻觉、对时间没概念、算术问题、一致性的抖动。

第 6 章进入整个连载里最细腻的地带:安全、对齐,以及"对用户真正有用"到底是什么意思。2026 版里新增了一节 §6.6,讲最新的对齐研究方向 — 宪法式 AI 和基于辩论的模型。

从第 7 章开始,焦点从"它怎么工作"切换到"怎么用它"。提示工程、工具调用与智能体(包括讲智能体模式的新 §8.6)、RAG、多模态,以及第 11 章 — 里面新增的 §11.6 整节讲推理模型。第 12 章合上整本书,带出系统视角,并为后面第 2 到第 7 卷搭起桥。

怎么读这些文章

每一篇都给三样东西:这章在解决什么核心问题的简短复述、主要的几个概念动作(技术词汇会用普通话讲清楚)、以及通向下一章的过渡。每篇五到八分钟读完 — 是配早晨咖啡的体量,不是吃掉整个周末的体量。

如果有哪一篇真的勾住了你,书里对应的章节会走得深得多,还配有图、例子,以及把每一个技术想法用日常话再说一遍的"用大白话讲"侧边栏。

目录 — 什么时候出什么

下面是十二篇的完整日程。每一篇都会准时上线,按顺序,不跳。如果你看到这页时某一篇还没出,后面的日期会告诉你它什么时候到。

2 月 18 日 — 第 1 章:所以,大语言模型究竟是什么?这个问题为什么没看上去那么显然,以及该尽早摆脱的三个误解。

2 月 19 日 — 第 2 章:概率、token 和文本。token 到底是什么、为什么模型每次给出的其实是整个概率分布而不是"一个答案"、以及 temperature 和 top-p 怎么改变输出的性格。

2 月 20 日 — 第 3 章:文本在模型里是怎么流动的。嵌入、注意力、Transformer 架构 — 不被矩阵淹没,也不丢精度。

2 月 21 日 — 第 4 章:模型是怎么学的。预训练、微调、RLHF — 以及每一段塑造的是什么。

2 月 22 日 — 第 5 章:它今天还在哪里磕绊。幻觉、时间、算术、一致性 — 为什么这些不是 bug,而是同一个机制的特性。

2 月 23 日 — 第 6 章:安全、对齐,以及"有用"到底是什么意思。包括新节 §6.6 讲宪法式 AI 和基于辩论的模型。

2 月 24 日 — 第 7 章:提示工程作为一门手艺。真正扛事的四个模式,以及它们为什么能行。

2 月 25 日 — 第 8 章:当一个模型不够 — 工具调用和智能体。加上新节 §8.6 讲智能体模式:ReAct、规划-执行、反思。

2 月 26 日 — 第 9 章:RAG — 怎么把新鲜信息缝进模型的上下文里。好 RAG 和坏 RAG 的分水岭。

2 月 27 日 — 第 10 章:多模态。同一个 Transformer 是怎么开始接收图像和音频的,以及它哪里还会迷路。

2 月 28 日 — 第 11 章:更小的模型,更聪明的模型。蒸馏、量化、MoE,以及讲推理模型的新节 §11.6。

3 月 1 日 — 第 12 章:搭一个 LLM 系统 — 以及之后呢。整本书的收尾,以及通向系列后续第 2–7 卷的桥。


想直接看完整的全貌? LLM Primer I: How Generative AI Works — 2026 版 — 就是这十二篇文章只在轻轻揭幕的那本书。在亚马逊上打开 →

明天,第 1 章见。


下田 昌平
下田 昌平
作为株式会社Receipt Roller的CEO兼CTO,目前负责开发电子收据服务以及自动将对话分类并生成行动任务的系统「ACTIONBRIDGE」。从小便接触编程,1996年参与开发测量仪器的相关程序,始终保持着对技术的深刻探索与热情。 在此前的职业生涯中,曾担任日本最大呼叫中心行业企业的子公司——一家研究开发公司的CEO/CTO,领导了多个技术开发项目。目前,我依然活跃在编程的最前沿,持续书写代码。