LLM介绍

本页面为AI爱好者提供从基础到应用的大型语言模型（LLM）指南。

共有43篇文章。 | 当前在第1页，共1页。

第 14 章 — 基准测试、测试与性能

LLM Primer IV 章节走读最后一篇。真 server 上的 MCP-Universe Benchmark、它暴露的两种系统性故障、每请求一会话跟共享会话池之间的十倍吞吐差距,以及通往第 V 卷的桥。

2026-04-12

第 13 章 — 框架与云集成

LLM Primer IV 章节走读第 13 篇。配 Bedrock 的 Strands、AWS 状态层模式、Microsoft Agent Framework、LangChain、Semantic Kernel — 以及团队各自独立到达的三种生产集成形态。

2026-04-11

第 12 章 — 协议加固与防御

LLM Primer IV 章节走读第 12 篇。四簇防御 — 密码学背书、OAuth scope 纪律加有界会话、运行时沙箱、人工审批门 — 组合成一种不依赖模型在对抗条件下行为正确的安全姿态。

2026-04-10

第 11 章 — 攻击面与协议漏洞

LLM Primer IV 章节走读第 11 篇。被改造到 MCP 上的几个经典攻击 — Confused Deputy、Token Passthrough、Session Hijacking — 围绕能力升级和未认证 sampling 的协议级缺陷,以及让上下文投毒变成结构性问题而不是卫生问题的隐式信任传播。

2026-04-09

第 10 章 — 长时任务记忆

LLM Primer IV 章节走读第 10 篇。通过窗口和 ReAct scratchpad 的短期记忆,通过情景向量和语义存储的长期记忆,以及让 agent 跨小时跨天保持产出的压缩技巧。

2026-04-08

第 9 章 — 管理注意力预算

LLM Primer IV 章节走读第 9 篇。Context rot、lost-in-the-middle 这一道悬崖、tool-loadout rot,以及对 "模型缺的那一份知识到底该放在哪一层" 的三个架构答案 — MCP、RAG、微调。

2026-04-07

第 8 章 — 架构部署形态

LLM Primer IV 章节走读第 8 篇。MCP 生态里浮现出来的三种部署形态 — 可复用 agent、严格纯净、混合 — 以及决定哪一种适合哪个项目的四条约束。

2026-04-06

第 7 章 — 高级协作与动态模式

LLM Primer IV 章节走读第 7 篇。Roundtable 共识、handoff 路由、magentic 编排 — 当拓扑要按请求构建时出现的那些模式,以及它们带来的故障模式(不停机、错路由、计划失控)。

2026-04-05

第 6 章 — 基础编排策略

LLM Primer IV 章节走读第 6 篇。两种基础编排形状 — 顺序流水线和并发 scatter-gather — 以及每个团队都该先问的那个上游问题:多 agent 系统真的是这件事的答案吗?

2026-04-04

第 5 章 — 传输协议与发现

LLM Primer IV 章节走读第 5 篇。MCP 支持的三种传输,.well-known 这一层发现机制加 Server Card,以及那些无聊的运维问题 — CORS、Origin 校验、缓存 — 决定一个 server 是合作型网络公民还是负债。

2026-04-03

第 4 章 — 客户端原语:Agentic 行为与控制

LLM Primer IV 章节走读第 4 篇。Sampling、Roots、Elicitation 是 MCP 在 host-server 这堵墙上打的三个小洞 — 每一个都是 host 借给 server 的一份能力,也是替用户接住的一份风险。

2026-04-02

第 3 章 — 服务器原语:暴露上下文与能力

LLM Primer IV 章节走读第 3 篇。MCP server 能给的三个名词 — Resources(读状态)、Prompts(可复用脚手架)、Tools(写操作) — 它们的 schema、生命周期、错误模型,以及挑对原语这件事的纪律。

2026-04-01

第 2 章 — 揭开 Model Context Protocol(MCP)

LLM Primer IV 章节走读第 2 篇。MCP 到底标准化了什么,Host、Client、Server 三个角色的分工,动态发现和双向消息为什么在那些真正重要的场景里跟 REST 不一样,以及从能力协商开始的会话生命周期。

2026-03-31

第 1 章 — AI 集成危机与智能体架构的兴起

LLM Primer IV 章节走读第 1 篇。单体智能体为什么会随着 system prompt 变长而散掉,藏在底下的那个 N 乘 M 集成问题是什么,以及从 prompt 工程转向上下文工程这一步 — MCP 就是为了让这一步走得通而存在的。

2026-03-30

LLM Primer IV — 系列导读与目录

本文开启 LLM Primer 系列第四卷《用 MCP 设计 AI 认知》的章节走读。为什么智能体要靠一层协议才能从 demo 走到生产,这本书写给谁,以及 3 月 30 日到 4 月 12 日 14 篇连载的时间表。

2026-03-29

第 11 章 — 持续更新与流水线优化

LLM Primer III 章节走读最末一篇。流水线没有「做完」这件事 — 文档在变、查询在漂、模型在换 — 负它的团队学着在三种时间尺度上同时思考。结尾接到第四本 — MCP。

2026-03-28

第 10 章 — 主流评测框架

LLM Primer III 章节走读第十篇。三件套配上了工具箱 — 两脉里八个框架 — 加上对它们其中没人合上的那一块的一次诚实坦白。

2026-03-27

第 9 章 — RAG 评测三件套

LLM Primer III 章节走读第九篇。三种不同的故障塌成同一种症状 — 这个领域为此发明了一只三头的度量,终于告诉团队:那个症状对的是哪一种故障。

2026-03-26

第 8 章 — RAG 管线里的数据匿名化

LLM Primer III 章节走读第八篇。数据是该在模型看见之前匿名化、还是在用户看见输出之前?答案改写整条流水线的样子 — 而监管框架通常会替你做出答案。

2026-03-25

第 7 章 — 落实访问控制

LLM Primer III 章节走读第七篇。为关系数据库和文件系统设计的权限模型,套到检索上不完全合身。访问单位不再是一行或一份文件,而是一个嵌入 — 哪怕原文档已被拦,这个嵌入还能通过相似搜索把它漏出来。

2026-03-24

第 6 章 — RAG 的威胁模型

LLM Primer III 章节走读第六篇。纯 LLM 只有一条信任边界。一套 RAG 系统有很多 — 入库、解析、分块、嵌入、索引、检索、重排、生成、工具、输出 — 每一条都连着对手能塑形的输入。

2026-03-23

第 5 章 — 搭一条检索流水线

LLM Primer III 章节走读第五篇。一次向量搜索是大多数 demo 停下的地方,也是大多数生产故障开始的地方。本章一路走到生成器手里那一组候选,以及每一步存在的理由。

2026-03-22

第 4 章 — 选对向量数据库

LLM Primer III 章节走读第四篇。RAG 系统里长得最快、上量后最贵、把团队锁得最死的那一层 — 用技术指标比着选,用运维条件决定。

2026-03-21

第 3 章 — 进阶分块框架

LLM Primer III 章节走读第三篇。朴素的分块选择最会悄悄拖垮下游 — 以及最近两项把可能的上限都改写了的技术:contextual retrieval 与 late chunking。

2026-03-20

第 2 章 — 智能文档解析

LLM Primer III 章节走读第二篇。检索系统会继承它输入的质量 — 而那个让 RAG 质量平庸的最常见原因,就悄悄住在输入层。PDF 不是文本文件、版面感知解析器把哪些信号放回来,以及让模型直接读页面图像的那一路多模态。

2026-03-19

第 1 章 — RAG 架构的演进

LLM Primer III 章节走读第一篇。基础模型有两条结构性的限 — 知识封冻、来源不可指认 — 居然有同一个架构上的答案,而这个答案,三年里长出了四张脸。

2026-03-18

LLM Primer III — 系列导读与目录

LLM Primer 系列第三本《用 RAG 增强企业级 AI》的章节走读开篇。RAG 从外面看是三只盒子,做下去每一只都是一门独立的学问。十一篇文章,一天一章,把企业级 RAG 那一整套决策摊开来看。

2026-03-17

第11章 — 评估、校准与推理

LLM Primer II 章节走读第十一篇。怎么去衡量一个什么都能说的机器 — 困惑度、校准、benchmark 上那条少有人写的误差线,以及"测量幻觉"那件事的数学。

2026-03-13

第10章 — 后训练与对齐的数学

LLM Primer II 章节走读第十篇。后训练那一整套机器 — 监督微调、奖励模型、RLHF 上的 KL 缰绳,以及 DPO 那个把整条流水线塌成一条监督损失的漂亮推导。

2026-03-12

第 11 章 — 更小的模型,更聪明的模型

LLM Primer I 章节走读第十一篇。怎么把大模型压成在真实运营里能跑起来的尺寸 — 蒸馏、量化、MoE — 以及 2026 版新加的 §11.6,专门讲推理模型。

2026-02-28

第 10 章 — 多模态:走出文本

LLM Primer I 章节走读第十篇。同一个 Transformer 是怎么学会接收图像和音频的 — vision transformer 和音频 token 化 — 以及"一个模型什么都能看"这种说法老老实实的边界在哪。

2026-02-27

第 9 章 — RAG:把新鲜信息缝进上下文

LLM Primer I 章节走读第九篇。RAG(检索增强生成)到底在做什么、它是怎么补上模型的时间缺失和事实弱点的,以及好 RAG 和坏 RAG 的分水岭从哪儿开始。

2026-02-26

第 8 章 — 当一个模型不够:工具调用与智能体

LLM Primer I 章节走读第八篇。模型长出手脚的那块地 — 工具调用、函数调用、智能体 — 以及 2026 版 §8.6 这节新加的智能体模式:ReAct、规划-执行、反思。

2026-02-25

第 7 章 — 把提示工程当成一门手艺

LLM Primer I 章节走读第七篇。真正扛事的四个 prompt 模式 — system prompt、few-shot、思维链、角色 — 以及每个为什么能行,从下一个 token 的机制里讲清。

2026-02-24

第 5 章 — 还是有些小毛病

LLM Primer I 章节走读第五篇。即便是训得很好的 LLM 也还在犯的那几样毛病 — 幻觉、对时间没概念、算术、一致性抖动 — 为什么这些不是 bug,而是同一个"下一个 token 预测"机制的特性。

2026-02-22

第 4 章 — 模型是怎么学的

LLM Primer I 章节走读第四篇。为什么预训练决定能力上限,为什么微调塑造性格,以及 RLHF 是怎么把一个原始的"下一个 token 预测器"变成我们每天信任的那位助手。

2026-02-21

第 3 章 — 文本在模型里是怎么流动的

LLM Primer I 章节走读第三篇。token 进了模型之后到底经历了什么 — 嵌入、注意力、Transformer — 不被矩阵淹没,也不丢精度。

2026-02-20

第 2 章 — 概率、token 和文本

LLM Primer I 章节走读第二篇。token 和单词的区别、模型每一步构造出的那整张"下一个 token 概率分布"到底是什么,以及 temperature 和 top-p 怎么改变同一个模型的输出性格。

2026-02-19

第 1 章 — 所以,大语言模型究竟是什么?

LLM Primer I 章节走读第一篇。"大"、"语言"和"模型"这三个词到底分别意味着什么、从规则系统到神经网络我们是怎么一步步走过来的,以及三个值得尽早摆脱的误解。

2026-02-18

LLM Primer I — 章节走读:序言与目录

LLM Primer I 章节走读的开篇。整本书是怎么搭起来的、每一章给出什么,以及 2 月 18 日到 3 月 1 日这十二篇连载的发布日程。

2026-02-17

LLM Primer 系列 — 一卷一卷读懂生成式 AI 的实战指南

LLM Primer 系列 — 一套七卷的生成式 AI 实战指南,作者下田昌平。每一卷处理与 LLM 打交道的一个层面,从地基到规模化再到安全。这个页面是整套系列的入口:全系列总览,以及前几卷的章节走读。

2026-02-15

1.0 什么是LLM？大规模语言模型的定义与应用

了解大规模语言模型（LLM）的基本定义、工作原理以及其在自然语言处理中的应用。本文介绍了LLM的功能、优势，以及它如何与传统机器学习模型不同。

2024-09-02

大规模语言模型（LLM）全面指南：原理、应用与训练方法

深入探索大规模语言模型（LLM）的世界。本指南涵盖LLM的定义、在自然语言处理（NLP）中的作用、训练方法以及文本生成、翻译、问答系统和代码生成等实际应用。适合希望利用LLM开发创新解决方案的工程师与开发者。

2024-09-01