LLM介绍 - LLM Primer II — 透过数学看语言模型

本页面为AI爱好者提供从基础到应用的大型语言模型(LLM)指南。


共有2篇文章。 | 当前在第1页,共1页。

第11章 — 评估、校准与推理

LLM Primer II 章节走读第十一篇。怎么去衡量一个什么都能说的机器 — 困惑度、校准、benchmark 上那条少有人写的误差线,以及"测量幻觉"那件事的数学。

2026-03-13

第10章 — 后训练与对齐的数学

LLM Primer II 章节走读第十篇。后训练那一整套机器 — 监督微调、奖励模型、RLHF 上的 KL 缰绳,以及 DPO 那个把整条流水线塌成一条监督损失的漂亮推导。

2026-03-12