LLM介绍

本页面为AI爱好者提供从基础到应用的大型语言模型（LLM）指南。

共有11篇文章。 | 当前在第1页，共1页。

第 16 章 — 安全的微调与适配

LLM Primer VII 章节走读第 16 篇。这一章把微调后的模型当作一份"必须去挣、不是继承来的"安全性质的 artefact —— 因为教域内术语的同一步梯度,也能侵蚀基础模型带来的对齐。

2026-05-25

LLM Primer VII 章节走读第 15 篇。这一章把安全文化、红队、供应商风险和长期管理,当作那份跨年承载这门学科的组织基础设施。

2026-05-24

LLM Primer VII 章节走读第 13 篇。这一章把仍在整合中的、多元的监管全景,映射到前面几章开发出来的技术控制上。

2026-05-22

LLM Primer VII 章节走读第 9 篇。这一章把模型 artefact 当作由第三方分发的二进制来对待 —— 带着二进制分发一直带着的反序列化、后门和出处问题。

2026-05-18

LLM Primer II 章节走读第十一篇。怎么去衡量一个什么都能说的机器 — 困惑度、校准、benchmark 上那条少有人写的误差线,以及"测量幻觉"那件事的数学。

2026-03-13

LLM Primer II 章节走读第十篇。后训练那一整套机器 — 监督微调、奖励模型、RLHF 上的 KL 缰绳,以及 DPO 那个把整条流水线塌成一条监督损失的漂亮推导。

2026-03-12

LLM Primer I 章节走读第十一篇。怎么把大模型压成在真实运营里能跑起来的尺寸 — 蒸馏、量化、MoE — 以及 2026 版新加的 §11.6,专门讲推理模型。

2026-02-28

LLM Primer I 章节走读第六篇。为什么"听上去通顺"和"真的有用"是两件事、对齐到底在调什么,以及 2026 版里 §6.6 新增的那一节 — 宪法式 AI、基于辩论的模型,以及对齐领域里最新的研究方向。

2026-02-23

LLM Primer I 章节走读第四篇。为什么预训练决定能力上限,为什么微调塑造性格,以及 RLHF 是怎么把一个原始的"下一个 token 预测器"变成我们每天信任的那位助手。

2026-02-21

LLM Primer I 章节走读第三篇。token 进了模型之后到底经历了什么 — 嵌入、注意力、Transformer — 不被矩阵淹没,也不丢精度。

2026-02-20

LLM Primer I 章节走读的开篇。整本书是怎么搭起来的、每一章给出什么,以及 2 月 18 日到 3 月 1 日这十二篇连载的发布日程。

2026-02-17