LLM介绍
本页面为AI爱好者提供从基础到应用的大型语言模型(LLM)指南。
第11章 — 评估、校准与推理
LLM Primer II 章节走读第十一篇。怎么去衡量一个什么都能说的机器 — 困惑度、校准、benchmark 上那条少有人写的误差线,以及"测量幻觉"那件事的数学。
2026-03-13第10章 — 后训练与对齐的数学
LLM Primer II 章节走读第十篇。后训练那一整套机器 — 监督微调、奖励模型、RLHF 上的 KL 缰绳,以及 DPO 那个把整条流水线塌成一条监督损失的漂亮推导。
2026-03-12第 11 章 — 更小的模型,更聪明的模型
LLM Primer I 章节走读第十一篇。怎么把大模型压成在真实运营里能跑起来的尺寸 — 蒸馏、量化、MoE — 以及 2026 版新加的 §11.6,专门讲推理模型。
2026-02-28第 10 章 — 多模态:走出文本
LLM Primer I 章节走读第十篇。同一个 Transformer 是怎么学会接收图像和音频的 — vision transformer 和音频 token 化 — 以及"一个模型什么都能看"这种说法老老实实的边界在哪。
2026-02-27第 5 章 — 还是有些小毛病
LLM Primer I 章节走读第五篇。即便是训得很好的 LLM 也还在犯的那几样毛病 — 幻觉、对时间没概念、算术、一致性抖动 — 为什么这些不是 bug,而是同一个"下一个 token 预测"机制的特性。
2026-02-22第 4 章 — 模型是怎么学的
LLM Primer I 章节走读第四篇。为什么预训练决定能力上限,为什么微调塑造性格,以及 RLHF 是怎么把一个原始的"下一个 token 预测器"变成我们每天信任的那位助手。
2026-02-21LLM Primer I — 章节走读:序言与目录
LLM Primer I 章节走读的开篇。整本书是怎么搭起来的、每一章给出什么,以及 2 月 18 日到 3 月 1 日这十二篇连载的发布日程。
2026-02-17LLM Primer 系列 — 一卷一卷读懂生成式 AI 的实战指南
LLM Primer 系列 — 一套七卷的生成式 AI 实战指南,作者下田昌平。每一卷处理与 LLM 打交道的一个层面,从地基到规模化再到安全。这个页面是整套系列的入口:全系列总览,以及前几卷的章节走读。
2026-02-151.0 什么是LLM?大规模语言模型的定义与应用
了解大规模语言模型(LLM)的基本定义、工作原理以及其在自然语言处理中的应用。本文介绍了LLM的功能、优势,以及它如何与传统机器学习模型不同。
2024-09-02
大规模语言模型(LLM)全面指南:原理、应用与训练方法
深入探索大规模语言模型(LLM)的世界。本指南涵盖LLM的定义、在自然语言处理(NLP)中的作用、训练方法以及文本生成、翻译、问答系统和代码生成等实际应用。适合希望利用LLM开发创新解决方案的工程师与开发者。
2024-09-01