Введение в LLM
Эта страница предоставляет понятное руководство по большим языковым моделям (LLM), от основ до приложений для любителей ИИ.
Глава 10 — Память для долгих задач
Десятый пост поглавного разбора LLM Primer IV. Краткосрочная память через окна и ReAct-черновики, долгосрочная память через эпизодические векторы и семантические хранилища, и техники сжатия, держащие агента продуктивным часами и днями.
2026-04-08Глава 9 — Управление бюджетом внимания
Девятый пост поглавного разбора LLM Primer IV. Context rot, обрыв lost-in-the-middle, tool-loadout rot и три архитектурных ответа — MCP, RAG, дообучение — на вопрос, где на самом деле живёт недостающее знание модели.
2026-04-07Глава 6 — Фундаментальные стратегии оркестрации
Шестой пост поглавного разбора LLM Primer IV. Две базовые формы оркестрации — последовательные пайплайны и параллельный scatter-gather — и предварительный вопрос, который должна задать каждая команда: является ли мультиагентная система вообще правильным ответом?
2026-04-04Глава 4 — Клиентские примитивы: агентное поведение и контроль
Четвёртый пост поглавного разбора LLM Primer IV. Sampling, Roots и Elicitation — три небольших, контролируемых отверстия, которые MCP пробивает в стене между хостом и сервером, каждое — отданная назад возможность и принятый от имени пользователя риск.
2026-04-02Глава 7 — Реализация контроля доступа
Седьмой пост разбора LLM Primer III. Документ-уровневые ACL как фундамент, RBAC с метками чувствительности Microsoft Purview, ReBAC с Zanzibar и SpiceDB и дисциплина pre-filter против post-filter, работающая под всеми ними.
2026-03-24Глава 6 — Модели угроз и уязвимости RAG
Шестой пост разбора LLM Primer III. Расширенная поверхность атаки поиска — отравление корпуса, adversarial-чанки, непрямой prompt injection, инверсия эмбеддингов и проблема confused deputy в агентном RAG. Конкретные атаки, каждая продемонстрирована, каждая воспроизводима.
2026-03-23Глава 3 — Продвинутые фреймворки чанкинга
Третий пост разбора LLM Primer III. Спектр чанкинга от фиксированного размера до учёта структуры, миф об overlap, обрыв контекста, тихо разрушающий поиск, и техники contextual retrieval и late chunking, переписавшие фронтир.
2026-03-20Глава 2 — Интеллектуальный парсинг документов
Второй пост разбора LLM Primer III. Почему PDF — это не текстовый файл, что на самом деле сохраняют парсеры с учётом макета, текущий ландшафт инструментов (LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR) и мультимодальный трек, ищущий по изображениям страниц напрямую.
2026-03-19Глава 1 — Эволюция архитектуры RAG
Первый пост разбора LLM Primer III. Четыре архитектурные позы RAG — Naive, Advanced, Modular, Agentic — читаются как история о передаче LLM всё большей агентности по одному решению за раз, и честный ответ на вопрос, когда дообучение лучше поиска.
2026-03-18LLM Primer III — Введение в серию и оглавление
Открываем поглавный разбор третьей книги серии LLM Primer — Корпоративный ИИ с RAG. Почему retrieval-augmented generation выглядит просто снаружи и состоит из стопки дисциплин внутри, для кого эта книга и расписание одиннадцати постов с 18 по 28 марта.
2026-03-17