LLM介绍

本页面为AI爱好者提供从基础到应用的大型语言模型(LLM)指南。


共有8篇文章。 | 当前在第1页,共1页。

第10章 — 后训练与对齐的数学

LLM Primer II 章节走读第十篇。后训练那一整套机器 — 监督微调、奖励模型、RLHF 上的 KL 缰绳,以及 DPO 那个把整条流水线塌成一条监督损失的漂亮推导。

2026-03-12

第 12 章 — 搭一个 LLM 系统,以及之后

LLM Primer I 章节走读的最后一篇。模型、工具、RAG、评估、护栏 — 缝成一套系统;以及从第 1 卷通往第 2–7 卷的那座桥。

2026-03-01

第 7 章 — 把提示工程当成一门手艺

LLM Primer I 章节走读第七篇。真正扛事的四个 prompt 模式 — system prompt、few-shot、思维链、角色 — 以及每个为什么能行,从下一个 token 的机制里讲清。

2026-02-24

第 6 章 — 安全、对齐,以及"有用"到底是什么意思

LLM Primer I 章节走读第六篇。为什么"听上去通顺"和"真的有用"是两件事、对齐到底在调什么,以及 2026 版里 §6.6 新增的那一节 — 宪法式 AI、基于辩论的模型,以及对齐领域里最新的研究方向。

2026-02-23

第 5 章 — 还是有些小毛病

LLM Primer I 章节走读第五篇。即便是训得很好的 LLM 也还在犯的那几样毛病 — 幻觉、对时间没概念、算术、一致性抖动 — 为什么这些不是 bug,而是同一个"下一个 token 预测"机制的特性。

2026-02-22

第 2 章 — 概率、token 和文本

LLM Primer I 章节走读第二篇。token 和单词的区别、模型每一步构造出的那整张"下一个 token 概率分布"到底是什么,以及 temperature 和 top-p 怎么改变同一个模型的输出性格。

2026-02-19

第 1 章 — 所以,大语言模型究竟是什么?

LLM Primer I 章节走读第一篇。"大"、"语言"和"模型"这三个词到底分别意味着什么、从规则系统到神经网络我们是怎么一步步走过来的,以及三个值得尽早摆脱的误解。

2026-02-18

LLM Primer 系列 — 一卷一卷读懂生成式 AI 的实战指南

LLM Primer 系列 — 一套七卷的生成式 AI 实战指南,作者下田昌平。每一卷处理与 LLM 打交道的一个层面,从地基到规模化再到安全。这个页面是整套系列的入口:全系列总览,以及前几卷的章节走读。

2026-02-15