LLM介绍

本页面为AI爱好者提供从基础到应用的大型语言模型(LLM)指南。


共有7篇文章。 | 当前在第1页,共1页。

第11章 — 评估、校准与推理

LLM Primer II 章节走读第十一篇。怎么去衡量一个什么都能说的机器 — 困惑度、校准、benchmark 上那条少有人写的误差线,以及"测量幻觉"那件事的数学。

2026-03-13

第 3 章 — 文本在模型里是怎么流动的

LLM Primer I 章节走读第三篇。token 进了模型之后到底经历了什么 — 嵌入、注意力、Transformer — 不被矩阵淹没,也不丢精度。

2026-02-20

第 1 章 — 所以,大语言模型究竟是什么?

LLM Primer I 章节走读第一篇。"大"、"语言"和"模型"这三个词到底分别意味着什么、从规则系统到神经网络我们是怎么一步步走过来的,以及三个值得尽早摆脱的误解。

2026-02-18

LLM Primer I — 章节走读:序言与目录

LLM Primer I 章节走读的开篇。整本书是怎么搭起来的、每一章给出什么,以及 2 月 18 日到 3 月 1 日这十二篇连载的发布日程。

2026-02-17

LLM Primer 系列 — 一卷一卷读懂生成式 AI 的实战指南

LLM Primer 系列 — 一套七卷的生成式 AI 实战指南,作者下田昌平。每一卷处理与 LLM 打交道的一个层面,从地基到规模化再到安全。这个页面是整套系列的入口:全系列总览,以及前几卷的章节走读。

2026-02-15

1.0 什么是LLM?大规模语言模型的定义与应用

了解大规模语言模型(LLM)的基本定义、工作原理以及其在自然语言处理中的应用。本文介绍了LLM的功能、优势,以及它如何与传统机器学习模型不同。

2024-09-02

大规模语言模型(LLM)全面指南:原理、应用与训练方法

深入探索大规模语言模型(LLM)的世界。本指南涵盖LLM的定义、在自然语言处理(NLP)中的作用、训练方法以及文本生成、翻译、问答系统和代码生成等实际应用。适合希望利用LLM开发创新解决方案的工程师与开发者。

2024-09-01