Введение в LLM
Эта страница предоставляет понятное руководство по большим языковым моделям (LLM), от основ до приложений для любителей ИИ.
Глава 14 — Бенчмаркинг, тестирование и производительность
Пятнадцатый и финальный пост поглавного разбора LLM Primer IV. MCP-Universe Benchmark на реальных серверах, два системных режима отказа, которые он раскрыл, десятикратный разрыв пропускной способности между session-per-request и пулом сессий, и мост к тому V.
2026-04-12Глава 12 — Закаливание протокола и защиты
Двенадцатый пост поглавного разбора LLM Primer IV. Четыре кластера защит — криптографическая аттестация, OAuth-дисциплина скоупов с ограниченными сессиями, runtime-песочница и human-in-the-loop-ворота — складываются в позицию, не зависящую от того, что модель ведёт себя правильно в адверсариальных условиях.
2026-04-10Глава 11 — Поверхности атак и уязвимости протокола
Одиннадцатый пост поглавного разбора LLM Primer IV. Классические атаки, адаптированные к MCP — Confused Deputy, Token Passthrough, Session Hijacking — протокол-уровневые изъяны вокруг capability escalation и неаутентифицированного sampling, и неявное распространение доверия, делающее отравление контекста структурной проблемой, а не вопросом гигиены.
2026-04-09Глава 10 — Память для долгих задач
Десятый пост поглавного разбора LLM Primer IV. Краткосрочная память через окна и ReAct-черновики, долгосрочная память через эпизодические векторы и семантические хранилища, и техники сжатия, держащие агента продуктивным часами и днями.
2026-04-08Глава 8 — Архитектурные раскладки развёртывания
Восьмой пост поглавного разбора LLM Primer IV. Три раскладки развёртывания, проявившиеся в MCP-экосистеме — reusable agent, strict purity, hybrid, — и четыре связывающих ограничения, определяющих, какая подходит какому проекту.
2026-04-06Глава 6 — Фундаментальные стратегии оркестрации
Шестой пост поглавного разбора LLM Primer IV. Две базовые формы оркестрации — последовательные пайплайны и параллельный scatter-gather — и предварительный вопрос, который должна задать каждая команда: является ли мультиагентная система вообще правильным ответом?
2026-04-04Глава 4 — Клиентские примитивы: агентное поведение и контроль
Четвёртый пост поглавного разбора LLM Primer IV. Sampling, Roots и Elicitation — три небольших, контролируемых отверстия, которые MCP пробивает в стене между хостом и сервером, каждое — отданная назад возможность и принятый от имени пользователя риск.
2026-04-02Глава 3 — Серверные примитивы: экспонирование контекста и возможностей
Третий пост поглавного разбора LLM Primer IV. Три существительных, которые может предложить MCP-сервер — Resources (чтение состояния), Prompts (переиспользуемые шаблоны), Tools (действия записи), — их схемы, жизненные циклы, модели ошибок и дисциплина выбора правильного примитива.
2026-04-01Глава 1 — Кризис интеграций ИИ и подъём агентной архитектуры
Первый пост поглавного разбора LLM Primer IV. Почему монолитные агенты распадаются по мере роста системных промптов, проблема интеграций N на M, скрытая под этим, и переход от prompt engineering к context engineering, под который и был построен MCP.
2026-03-30Глава 10 — Ведущие фреймворки оценки
Десятый пост разбора LLM Primer III. Полевой путеводитель по фреймворкам, превращающим Триаду оценки в нечто, что команда способна реально гонять — RAGAS, TruLens, DeepEval с одной стороны, Braintrust, LangSmith, Phoenix, Galileo, Opik с другой, и Evaluation Gap, которую ни один пока не закрыл.
2026-03-27Глава 8 — Анонимизация данных в RAG-пайплайне
Восьмой пост разбора LLM Primer III. Анонимизация до генерации против после, три семейства техник — маскирование, синтетическая замена, дифференциальная приватность — и компромисс полезность–приватность, определяющий, остаётся ли система вообще полезной.
2026-03-25Глава 7 — Реализация контроля доступа
Седьмой пост разбора LLM Primer III. Документ-уровневые ACL как фундамент, RBAC с метками чувствительности Microsoft Purview, ReBAC с Zanzibar и SpiceDB и дисциплина pre-filter против post-filter, работающая под всеми ними.
2026-03-24Глава 6 — Модели угроз и уязвимости RAG
Шестой пост разбора LLM Primer III. Расширенная поверхность атаки поиска — отравление корпуса, adversarial-чанки, непрямой prompt injection, инверсия эмбеддингов и проблема confused deputy в агентном RAG. Конкретные атаки, каждая продемонстрирована, каждая воспроизводима.
2026-03-23Глава 4 — Выбор подходящей векторной базы данных
Четвёртый пост разбора LLM Primer III. Архитектурный раздел между специализированными векторными базами и расширениями вроде Postgres, лидеры managed-сегмента (Pinecone, Vertex), open-source поле (Qdrant, Milvus, Weaviate), встраиваемые опции и три операционные оси — резидентность, ops, стоимость, на которых решается реальный выбор.
2026-03-21Глава 3 — Продвинутые фреймворки чанкинга
Третий пост разбора LLM Primer III. Спектр чанкинга от фиксированного размера до учёта структуры, миф об overlap, обрыв контекста, тихо разрушающий поиск, и техники contextual retrieval и late chunking, переписавшие фронтир.
2026-03-20LLM Primer III — Введение в серию и оглавление
Открываем поглавный разбор третьей книги серии LLM Primer — Корпоративный ИИ с RAG. Почему retrieval-augmented generation выглядит просто снаружи и состоит из стопки дисциплин внутри, для кого эта книга и расписание одиннадцати постов с 18 по 28 марта.
2026-03-17Глава 12 — Построить LLM-систему, и что дальше
Последний пост разбора LLM Primer I по главам. Модель, инструменты, RAG, оценка и ограждения, сшитые в одну систему — и мост от Книги 1 к Книгам 2–7 серии.
2026-03-01Глава 8 — Когда одной модели мало: инструменты и агенты
Восьмой пост разбора LLM Primer I по главам. Территория, где модель обретает руки — использование инструментов, вызов функций, агенты — и новый §8.6 издания 2026 года с паттернами агентов: ReAct, планировщик-исполнитель, рефлексия.
2026-02-25Глава 5 — Ещё остаются мелкие изъяны
Пятый пост разбора LLM Primer I по главам. Почему галлюцинации, отсутствие чувства времени, проблемы с вычислениями и колебания согласованности — не баги, а свойства одного и того же механизма предсказания следующего токена.
2026-02-22Глава 4 — Как модель обучается
Четвёртый пост разбора LLM Primer I по главам. Почему предобучение задаёт потолок способностей, почему fine-tuning лепит характер, и как RLHF превращает простого предсказателя токенов в того ассистента, которому мы доверяем ежедневно.
2026-02-21Глава 1 — Что такое, в сущности, Большая Языковая Модель?
Первый пост разбора LLM Primer I по главам. Что на самом деле означают слова «большая», «языковая» и «модель», как мы прошли путь от систем на правилах до нейросетей, и три мифа, от которых стоит избавиться сразу.
2026-02-18