Введение в LLM
Эта страница предоставляет понятное руководство по большим языковым моделям (LLM), от основ до приложений для любителей ИИ.
Глава 9 — Управление бюджетом внимания
Девятый пост поглавного разбора LLM Primer IV. Context rot, обрыв lost-in-the-middle, tool-loadout rot и три архитектурных ответа — MCP, RAG, дообучение — на вопрос, где на самом деле живёт недостающее знание модели.
2026-04-07Глава 2 — Знакомство с Model Context Protocol (MCP)
Второй пост поглавного разбора LLM Primer IV. Что именно стандартизирует MCP, трёхролевое разделение Host, Client, Server, чем динамическое обнаружение и двунаправленный обмен сообщениями отличаются от REST в значимых случаях, и жизненный цикл сессии, открывающийся согласованием возможностей.
2026-03-31Глава 1 — Кризис интеграций ИИ и подъём агентной архитектуры
Первый пост поглавного разбора LLM Primer IV. Почему монолитные агенты распадаются по мере роста системных промптов, проблема интеграций N на M, скрытая под этим, и переход от prompt engineering к context engineering, под который и был построен MCP.
2026-03-30LLM Primer IV — Введение в серию и оглавление
Открываем поглавный разбор четвёртой книги серии LLM Primer — Проектирование когнитивных способностей ИИ с MCP. Почему агентам нужен протокольный слой, чтобы выйти за пределы демо, для кого эта книга и расписание четырнадцати постов с 30 марта по 12 апреля.
2026-03-29Глава 11 — Непрерывные обновления и оптимизация пайплайна
Одиннадцатый и заключительный пост разбора LLM Primer III. CDC и инкрементальная индексация держат корпус свежим, семантическое кеширование и тиринг моделей держат латентность низкой, а четырёхстадийная петля обратной связи закрывает разрыв между тем, что продакшен говорит команде, и тем, что команда реально меняет — плюс мост в Том IV про Model Context Protocol.
2026-03-28Глава 9 — Триада оценки RAG
Девятый пост разбора LLM Primer III. RAG-система может отказывать в трёх разных местах, а отказы снаружи неразличимы. Триада оценки — релевантность контекста, верность и релевантность ответа — это малый словарь, не дающий чинить одну ошибку, измеряя другую.
2026-03-26Глава 3 — Продвинутые фреймворки чанкинга
Третий пост разбора LLM Primer III. Спектр чанкинга от фиксированного размера до учёта структуры, миф об overlap, обрыв контекста, тихо разрушающий поиск, и техники contextual retrieval и late chunking, переписавшие фронтир.
2026-03-20