LLM介绍
本页面为AI爱好者提供从基础到应用的大型语言模型(LLM)指南。
第 11 章 — 持续更新与流水线优化
LLM Primer III 章节走读最末一篇。流水线没有「做完」这件事 — 文档在变、查询在漂、模型在换 — 负它的团队学着在三种时间尺度上同时思考。结尾接到第四本 — MCP。
2026-03-28第 9 章 — RAG 评测三件套
LLM Primer III 章节走读第九篇。三种不同的故障塌成同一种症状 — 这个领域为此发明了一只三头的度量,终于告诉团队:那个症状对的是哪一种故障。
2026-03-26第 8 章 — RAG 管线里的数据匿名化
LLM Primer III 章节走读第八篇。数据是该在模型看见之前匿名化、还是在用户看见输出之前?答案改写整条流水线的样子 — 而监管框架通常会替你做出答案。
2026-03-25第 7 章 — 落实访问控制
LLM Primer III 章节走读第七篇。为关系数据库和文件系统设计的权限模型,套到检索上不完全合身。访问单位不再是一行或一份文件,而是一个嵌入 — 哪怕原文档已被拦,这个嵌入还能通过相似搜索把它漏出来。
2026-03-24第 6 章 — RAG 的威胁模型
LLM Primer III 章节走读第六篇。纯 LLM 只有一条信任边界。一套 RAG 系统有很多 — 入库、解析、分块、嵌入、索引、检索、重排、生成、工具、输出 — 每一条都连着对手能塑形的输入。
2026-03-23第 5 章 — 搭一条检索流水线
LLM Primer III 章节走读第五篇。一次向量搜索是大多数 demo 停下的地方,也是大多数生产故障开始的地方。本章一路走到生成器手里那一组候选,以及每一步存在的理由。
2026-03-22第 3 章 — 进阶分块框架
LLM Primer III 章节走读第三篇。朴素的分块选择最会悄悄拖垮下游 — 以及最近两项把可能的上限都改写了的技术:contextual retrieval 与 late chunking。
2026-03-20第 2 章 — 智能文档解析
LLM Primer III 章节走读第二篇。检索系统会继承它输入的质量 — 而那个让 RAG 质量平庸的最常见原因,就悄悄住在输入层。PDF 不是文本文件、版面感知解析器把哪些信号放回来,以及让模型直接读页面图像的那一路多模态。
2026-03-19第 1 章 — RAG 架构的演进
LLM Primer III 章节走读第一篇。基础模型有两条结构性的限 — 知识封冻、来源不可指认 — 居然有同一个架构上的答案,而这个答案,三年里长出了四张脸。
2026-03-18LLM Primer III — 系列导读与目录
LLM Primer 系列第三本《用 RAG 增强企业级 AI》的章节走读开篇。RAG 从外面看是三只盒子,做下去每一只都是一门独立的学问。十一篇文章,一天一章,把企业级 RAG 那一整套决策摊开来看。
2026-03-17