LLM Primer IV — Проектирование когнитивных способностей ИИ с MCP: введение в серию и оглавление
«Агенты ровно настолько хороши, насколько хорош контекст, который они видят, инструменты, до которых они дотягиваются, и память, которую они носят с собой». Добро пожаловать в четвёртую книгу серии LLM Primer — и в её поглавный разбор. Следующие четырнадцать дней, по одному посту на главу, мы будем открывать Model Context Protocol и слой когниции, который он делает возможным, и смотреть на решения, от которых зависит, тихо работает агентная система или тихо отказывает.
Почему существует четвёртая книга
Книги I, II и III этой серии дали вам модель и поисковый аппарат вокруг неё. Первая рассказала простым языком, что такое LLM. Вторая открыла лежащую под ними математику. Третья прошла production-архитектуру RAG. Четвёртая — о том, что окружает модель, когда вы пытаетесь заставить её действовать: вызывать инструменты, держать состояние между ходами, координироваться с другими агентами и делать всё это без переписывания интеграционного клея каждый квартал.
Паттерн, сломавшийся в 2025 году, — это монолитный агент: длинный системный промпт, горстка инструментов, единственное окно контекста, от которого требуют впитать всё сразу. Для демо это работало. В продакшене распадалось по мере того, как промпты росли, поверхности инструментов расширялись, а каждый новый релиз модели требовал ещё одного раунда штучного адаптерного кода. Диагноз сошёлся с нескольких сторон — размывание контекста, столкновение инструкций, матрица интеграций N на M — и указал на один и тот же архитектурный ответ: протокольный слой под моделью, позволяющий агентам обнаруживать возможности, согласовывать сессии и компоновать инструменты без того, чтобы стороны заранее знали друг о друге.
Этот слой и есть Model Context Protocol. Книга проходит его честно, слой за слоем. Обещание не в том, что MCP решает каждую агентную проблему. Обещание в том, что к концу вы будете знать, что протокол вам даёт, чего не даёт и какие построенные на нём паттерны переживают встречу с продакшеном.
Для кого книга
Для инженеров, строящих агентные системы; для технических PM, формирующих их рамки; и для архитекторов, которым придётся защищать выбор перед security-ревью. Книга предполагает, что читатель знаком с картиной поведения LLM из первой книги и картиной устройства поиска из третьей; математика второй книги не требуется. Центр тяжести — инженерия: где живут режимы отказа, какие решения обратимы, а какие фиксируют команду на годы.
Как её читать
Три режима, оправдавшие себя у ранних читателей. От начала к концу — если вы собираетесь начинать MCP-агентную систему и хотите получить протокол в том порядке, в котором решения реально приходят. Как справочник — если у вас есть работающая система и болит конкретный слой; главы про транспорт, про память, про безопасность стоят сами по себе. Или как материал для архитектурного ревью, где главы становятся темами разговора, который команде нужно провести до фиксации топологии развёртывания.
Четырнадцать глав
30 марта — Глава 1: Кризис интеграций ИИ и подъём агентной архитектуры. Почему монолитные агенты распадаются, что такое проблема интеграций N на M и переход от prompt engineering к context engineering.
31 марта — Глава 2: Знакомство с Model Context Protocol. Что именно стандартизирует MCP, три роли (Host, Client, Server), чем динамическое обнаружение отличается от REST и жизненный цикл сессии с согласованием возможностей.
1 апреля — Глава 3: Серверные примитивы: экспонирование контекста и возможностей. Resources, Prompts и Tools — три существительных, которые сервер может предложить, их схемы, их жизненные циклы и дисциплина выбора правильного примитива под каждую вещь.
2 апреля — Глава 4: Клиентские примитивы: Sampling, Roots, Elicitation. Обратная поверхность — то, что хост одалживает серверу, и последствия безопасности каждой возможности, переданной через границу доверия.
3 апреля — Глава 5: Транспорт и обнаружение. stdio против Streamable HTTP, когда выбирать каждый и как серверы и клиенты находят друг друга в локальных и удалённых развёртываниях.
4 апреля — Глава 6: Фундаментальные стратегии оркестрации. Две базовые формы — последовательные пайплайны и параллельный scatter-gather — и предварительный вопрос: нужна ли вообще мультиагентная система.
5 апреля — Глава 7: Продвинутые совместные и динамические паттерны. Roundtable, handoff и magentic — паттерны, возникающие, когда топология строится под запрос.
6 апреля — Глава 8: Архитектурные раскладки развёртывания. Reusable agent, strict purity, hybrid — три топологии и четыре связывающих ограничения.
7 апреля — Глава 9: Управление бюджетом внимания. Context rot, обрыв lost-in-the-middle и три архитектурных ответа — MCP, RAG, дообучение — на вопрос, где живёт недостающее знание модели.
8 апреля — Глава 10: Память для долгих задач. Краткосрочная память через окна и ReAct, долгосрочная через эпизодические векторы и семантические хранилища, техники компактификации.
9 апреля — Глава 11: Поверхности атак и уязвимости протокола. Confused Deputy, Token Passthrough, Session Hijacking, неаутентифицированный sampling и структурная проблема отравления контекста.
10 апреля — Глава 12: Закаливание протокола и защиты. Криптографическая аттестация, дисциплина OAuth-скоупов, runtime-песочница и human-in-the-loop — четыре кластера защит, складывающихся в развёртываемую позицию.
11 апреля — Глава 13: Фреймворки и облачная интеграция. Strands с Bedrock, Microsoft Agent Framework, LangChain, Semantic Kernel — три производственные формы интеграции, к которым команды приходят независимо.
12 апреля — Глава 14: Бенчмаркинг, тестирование и производительность. MCP-Universe Benchmark, два системных режима отказа и десятикратный разрыв пропускной способности между session-per-request и пулом сессий.
Об этой книге и о серии
Серия LLM Primer — длинный ответ на вопрос, который мне раз за разом задавали инженеры, основатели и иногда регуляторы: как эти системы устроены на самом деле и что нужно, чтобы построить такую, которая выдержит нагрузку? Первая книга задала форму. Вторая дала математику. Третья — production-архитектуру RAG. Четвёртая даёт слой когниции, сидящий над моделью. Пятая, в работе, поворачивает к построению реальных LLM-приложений от начала до конца.
Увидимся завтра, с главой 1.