LLM介绍 - LLM Primer II — 透过数学看语言模型
本页面为AI爱好者提供从基础到应用的大型语言模型(LLM)指南。
共有2篇文章。 |
当前在第1页,共1页。
第11章 — 评估、校准与推理
LLM Primer II 章节走读第十一篇。怎么去衡量一个什么都能说的机器 — 困惑度、校准、benchmark 上那条少有人写的误差线,以及"测量幻觉"那件事的数学。
2026-03-13第10章 — 后训练与对齐的数学
LLM Primer II 章节走读第十篇。后训练那一整套机器 — 监督微调、奖励模型、RLHF 上的 KL 缰绳,以及 DPO 那个把整条流水线塌成一条监督损失的漂亮推导。
2026-03-12