LLM介绍

本页面为AI爱好者提供从基础到应用的大型语言模型(LLM)指南。


共有13篇文章。 | 当前在第1页,共1页。

第11章 — 评估、校准与推理

LLM Primer II 章节走读第十一篇。怎么去衡量一个什么都能说的机器 — 困惑度、校准、benchmark 上那条少有人写的误差线,以及"测量幻觉"那件事的数学。

2026-03-13

第 11 章 — 更小的模型,更聪明的模型

LLM Primer I 章节走读第十一篇。怎么把大模型压成在真实运营里能跑起来的尺寸 — 蒸馏、量化、MoE — 以及 2026 版新加的 §11.6,专门讲推理模型。

2026-02-28

第 10 章 — 多模态:走出文本

LLM Primer I 章节走读第十篇。同一个 Transformer 是怎么学会接收图像和音频的 — vision transformer 和音频 token 化 — 以及"一个模型什么都能看"这种说法老老实实的边界在哪。

2026-02-27

第 9 章 — RAG:把新鲜信息缝进上下文

LLM Primer I 章节走读第九篇。RAG(检索增强生成)到底在做什么、它是怎么补上模型的时间缺失和事实弱点的,以及好 RAG 和坏 RAG 的分水岭从哪儿开始。

2026-02-26

第 8 章 — 当一个模型不够:工具调用与智能体

LLM Primer I 章节走读第八篇。模型长出手脚的那块地 — 工具调用、函数调用、智能体 — 以及 2026 版 §8.6 这节新加的智能体模式:ReAct、规划-执行、反思。

2026-02-25

第 7 章 — 把提示工程当成一门手艺

LLM Primer I 章节走读第七篇。真正扛事的四个 prompt 模式 — system prompt、few-shot、思维链、角色 — 以及每个为什么能行,从下一个 token 的机制里讲清。

2026-02-24

第 6 章 — 安全、对齐,以及"有用"到底是什么意思

LLM Primer I 章节走读第六篇。为什么"听上去通顺"和"真的有用"是两件事、对齐到底在调什么,以及 2026 版里 §6.6 新增的那一节 — 宪法式 AI、基于辩论的模型,以及对齐领域里最新的研究方向。

2026-02-23

第 5 章 — 还是有些小毛病

LLM Primer I 章节走读第五篇。即便是训得很好的 LLM 也还在犯的那几样毛病 — 幻觉、对时间没概念、算术、一致性抖动 — 为什么这些不是 bug,而是同一个"下一个 token 预测"机制的特性。

2026-02-22

第 4 章 — 模型是怎么学的

LLM Primer I 章节走读第四篇。为什么预训练决定能力上限,为什么微调塑造性格,以及 RLHF 是怎么把一个原始的"下一个 token 预测器"变成我们每天信任的那位助手。

2026-02-21

第 3 章 — 文本在模型里是怎么流动的

LLM Primer I 章节走读第三篇。token 进了模型之后到底经历了什么 — 嵌入、注意力、Transformer — 不被矩阵淹没,也不丢精度。

2026-02-20

第 2 章 — 概率、token 和文本

LLM Primer I 章节走读第二篇。token 和单词的区别、模型每一步构造出的那整张"下一个 token 概率分布"到底是什么,以及 temperature 和 top-p 怎么改变同一个模型的输出性格。

2026-02-19

LLM Primer I — 章节走读:序言与目录

LLM Primer I 章节走读的开篇。整本书是怎么搭起来的、每一章给出什么,以及 2 月 18 日到 3 月 1 日这十二篇连载的发布日程。

2026-02-17

LLM Primer 系列 — 一卷一卷读懂生成式 AI 的实战指南

LLM Primer 系列 — 一套七卷的生成式 AI 实战指南,作者下田昌平。每一卷处理与 LLM 打交道的一个层面,从地基到规模化再到安全。这个页面是整套系列的入口:全系列总览,以及前几卷的章节走读。

2026-02-15