Введение в LLM

Эта страница предоставляет понятное руководство по большим языковым моделям (LLM), от основ до приложений для любителей ИИ.

Всего доступно 42 статей. | Текущая страница 1 из 1.

Глава 14 — Бенчмаркинг, тестирование и производительность

Пятнадцатый и финальный пост поглавного разбора LLM Primer IV. MCP-Universe Benchmark на реальных серверах, два системных режима отказа, которые он раскрыл, десятикратный разрыв пропускной способности между session-per-request и пулом сессий, и мост к тому V.

2026-04-12

Глава 13 — Фреймворки и облачная интеграция

Четырнадцатый пост поглавного разбора LLM Primer IV. Strands с Bedrock, AWS state-layer-паттерн, Microsoft Agent Framework, LangChain, Semantic Kernel — и три продакшен-формы интеграции, к которым команды приходят независимо.

2026-04-11

Глава 12 — Закаливание протокола и защиты

Двенадцатый пост поглавного разбора LLM Primer IV. Четыре кластера защит — криптографическая аттестация, OAuth-дисциплина скоупов с ограниченными сессиями, runtime-песочница и human-in-the-loop-ворота — складываются в позицию, не зависящую от того, что модель ведёт себя правильно в адверсариальных условиях.

2026-04-10

Глава 11 — Поверхности атак и уязвимости протокола

Одиннадцатый пост поглавного разбора LLM Primer IV. Классические атаки, адаптированные к MCP — Confused Deputy, Token Passthrough, Session Hijacking — протокол-уровневые изъяны вокруг capability escalation и неаутентифицированного sampling, и неявное распространение доверия, делающее отравление контекста структурной проблемой, а не вопросом гигиены.

2026-04-09

Глава 10 — Память для долгих задач

Десятый пост поглавного разбора LLM Primer IV. Краткосрочная память через окна и ReAct-черновики, долгосрочная память через эпизодические векторы и семантические хранилища, и техники сжатия, держащие агента продуктивным часами и днями.

2026-04-08

Глава 9 — Управление бюджетом внимания

Девятый пост поглавного разбора LLM Primer IV. Context rot, обрыв lost-in-the-middle, tool-loadout rot и три архитектурных ответа — MCP, RAG, дообучение — на вопрос, где на самом деле живёт недостающее знание модели.

2026-04-07

Глава 8 — Архитектурные раскладки развёртывания

Восьмой пост поглавного разбора LLM Primer IV. Три раскладки развёртывания, проявившиеся в MCP-экосистеме — reusable agent, strict purity, hybrid, — и четыре связывающих ограничения, определяющих, какая подходит какому проекту.

2026-04-06

Глава 7 — Продвинутые совместные и динамические паттерны

Седьмой пост поглавного разбора LLM Primer IV. Консенсус roundtable, handoff-маршрутизация и magentic-оркестрация — паттерны, возникающие, когда топологию приходится строить под запрос, и режимы отказа (не-завершение, мисс-маршрутизация, ускользающее планирование), которых избегают простые паттерны.

2026-04-05

Глава 6 — Фундаментальные стратегии оркестрации

Шестой пост поглавного разбора LLM Primer IV. Две базовые формы оркестрации — последовательные пайплайны и параллельный scatter-gather — и предварительный вопрос, который должна задать каждая команда: является ли мультиагентная система вообще правильным ответом?

2026-04-04

Глава 5 — Транспортные протоколы и обнаружение

Пятый пост поглавного разбора LLM Primer IV. Три транспорта, поддерживаемых MCP, слой обнаружения .well-known с Server Cards и скучные операционные заботы — CORS, валидация origin, кэширование, — решающие, является ли сервер кооперативным гражданином сети или обузой.

2026-04-03

Глава 4 — Клиентские примитивы: агентное поведение и контроль

Четвёртый пост поглавного разбора LLM Primer IV. Sampling, Roots и Elicitation — три небольших, контролируемых отверстия, которые MCP пробивает в стене между хостом и сервером, каждое — отданная назад возможность и принятый от имени пользователя риск.

2026-04-02

Глава 3 — Серверные примитивы: экспонирование контекста и возможностей

Третий пост поглавного разбора LLM Primer IV. Три существительных, которые может предложить MCP-сервер — Resources (чтение состояния), Prompts (переиспользуемые шаблоны), Tools (действия записи), — их схемы, жизненные циклы, модели ошибок и дисциплина выбора правильного примитива.

2026-04-01

Глава 2 — Знакомство с Model Context Protocol (MCP)

Второй пост поглавного разбора LLM Primer IV. Что именно стандартизирует MCP, трёхролевое разделение Host, Client, Server, чем динамическое обнаружение и двунаправленный обмен сообщениями отличаются от REST в значимых случаях, и жизненный цикл сессии, открывающийся согласованием возможностей.

2026-03-31

Глава 1 — Кризис интеграций ИИ и подъём агентной архитектуры

Первый пост поглавного разбора LLM Primer IV. Почему монолитные агенты распадаются по мере роста системных промптов, проблема интеграций N на M, скрытая под этим, и переход от prompt engineering к context engineering, под который и был построен MCP.

2026-03-30

LLM Primer IV — Введение в серию и оглавление

Открываем поглавный разбор четвёртой книги серии LLM Primer — Проектирование когнитивных способностей ИИ с MCP. Почему агентам нужен протокольный слой, чтобы выйти за пределы демо, для кого эта книга и расписание четырнадцати постов с 30 марта по 12 апреля.

2026-03-29

Глава 11 — Непрерывные обновления и оптимизация пайплайна

Одиннадцатый и заключительный пост разбора LLM Primer III. CDC и инкрементальная индексация держат корпус свежим, семантическое кеширование и тиринг моделей держат латентность низкой, а четырёхстадийная петля обратной связи закрывает разрыв между тем, что продакшен говорит команде, и тем, что команда реально меняет — плюс мост в Том IV про Model Context Protocol.

2026-03-28

Глава 10 — Ведущие фреймворки оценки

Десятый пост разбора LLM Primer III. Полевой путеводитель по фреймворкам, превращающим Триаду оценки в нечто, что команда способна реально гонять — RAGAS, TruLens, DeepEval с одной стороны, Braintrust, LangSmith, Phoenix, Galileo, Opik с другой, и Evaluation Gap, которую ни один пока не закрыл.

2026-03-27

Глава 9 — Триада оценки RAG

Девятый пост разбора LLM Primer III. RAG-система может отказывать в трёх разных местах, а отказы снаружи неразличимы. Триада оценки — релевантность контекста, верность и релевантность ответа — это малый словарь, не дающий чинить одну ошибку, измеряя другую.

2026-03-26

Глава 8 — Анонимизация данных в RAG-пайплайне

Восьмой пост разбора LLM Primer III. Анонимизация до генерации против после, три семейства техник — маскирование, синтетическая замена, дифференциальная приватность — и компромисс полезность–приватность, определяющий, остаётся ли система вообще полезной.

2026-03-25

Глава 7 — Реализация контроля доступа

Седьмой пост разбора LLM Primer III. Документ-уровневые ACL как фундамент, RBAC с метками чувствительности Microsoft Purview, ReBAC с Zanzibar и SpiceDB и дисциплина pre-filter против post-filter, работающая под всеми ними.

2026-03-24

Глава 6 — Модели угроз и уязвимости RAG

Шестой пост разбора LLM Primer III. Расширенная поверхность атаки поиска — отравление корпуса, adversarial-чанки, непрямой prompt injection, инверсия эмбеддингов и проблема confused deputy в агентном RAG. Конкретные атаки, каждая продемонстрирована, каждая воспроизводима.

2026-03-23

Глава 5 — Архитектура поискового пайплайна

Пятый пост разбора LLM Primer III. Почему одиночный векторный поиск — это не пайплайн: гибридный поиск, reciprocal rank fusion, cross-encoder reranking и переписывание запроса и HyDE, собранные в продакшен-архитектуру, к которой сходятся зрелые RAG-системы.

2026-03-22

Глава 4 — Выбор подходящей векторной базы данных

Четвёртый пост разбора LLM Primer III. Архитектурный раздел между специализированными векторными базами и расширениями вроде Postgres, лидеры managed-сегмента (Pinecone, Vertex), open-source поле (Qdrant, Milvus, Weaviate), встраиваемые опции и три операционные оси — резидентность, ops, стоимость, на которых решается реальный выбор.

2026-03-21

Глава 3 — Продвинутые фреймворки чанкинга

Третий пост разбора LLM Primer III. Спектр чанкинга от фиксированного размера до учёта структуры, миф об overlap, обрыв контекста, тихо разрушающий поиск, и техники contextual retrieval и late chunking, переписавшие фронтир.

2026-03-20

Глава 2 — Интеллектуальный парсинг документов

Второй пост разбора LLM Primer III. Почему PDF — это не текстовый файл, что на самом деле сохраняют парсеры с учётом макета, текущий ландшафт инструментов (LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR) и мультимодальный трек, ищущий по изображениям страниц напрямую.

2026-03-19

Глава 1 — Эволюция архитектуры RAG

Первый пост разбора LLM Primer III. Четыре архитектурные позы RAG — Naive, Advanced, Modular, Agentic — читаются как история о передаче LLM всё большей агентности по одному решению за раз, и честный ответ на вопрос, когда дообучение лучше поиска.

2026-03-18

LLM Primer III — Введение в серию и оглавление

Открываем поглавный разбор третьей книги серии LLM Primer — Корпоративный ИИ с RAG. Почему retrieval-augmented generation выглядит просто снаружи и состоит из стопки дисциплин внутри, для кого эта книга и расписание одиннадцати постов с 18 по 28 марта.

2026-03-17

Глава 11 — Оценка, калибровка и вывод

Одиннадцатый пост разбора LLM Primer II: Language Models Through Mathematics по главам. Глава, в которой мы задаёмся вопросом: как вообще измерить машину, способную сказать что угодно — и обнаруживаем, что уверенная модель часто оказывается плохо откалиброванной.

2026-03-13

Глава 10 — Математика дообучения и согласования

Десятый пост разбора LLM Primer II: Language Models Through Mathematics по главам. Как блестящего, но дикого предсказателя следующего токена превращают в полезного ассистента — и как целый конвейер обучения с подкреплением одной красивой выкладкой сворачивается в обычное обучение с учителем.

2026-03-12

Глава 12 — Построить LLM-систему, и что дальше

Последний пост разбора LLM Primer I по главам. Модель, инструменты, RAG, оценка и ограждения, сшитые в одну систему — и мост от Книги 1 к Книгам 2–7 серии.

2026-03-01

Глава 11 — Меньше модели, умнее модели

Одиннадцатый пост разбора LLM Primer I по главам. Как уменьшить большие модели до размеров реальной эксплуатации — дистилляция, квантизация, MoE — и новая секция §11.6 издания 2026 года о моделях рассуждения.

2026-02-28

Глава 10 — Мультимодальность: за пределами текста

Десятый пост разбора LLM Primer I по главам. Как тот же трансформер научился принимать картинки и звук — vision transformer и токенизация аудио — и честные ограничения за идеей «одна модель, которая видит всё».

2026-02-27

Глава 9 — RAG: сшиваем свежую информацию в контекст

Девятый пост разбора LLM Primer I по главам. Что на самом деле делает RAG (Retrieval-Augmented Generation), как он подпирает чувство времени и фактическую точность модели, и где начинается разница между хорошим и плохим RAG.

2026-02-26

Глава 8 — Когда одной модели мало: инструменты и агенты

Восьмой пост разбора LLM Primer I по главам. Территория, где модель обретает руки — использование инструментов, вызов функций, агенты — и новый §8.6 издания 2026 года с паттернами агентов: ReAct, планировщик-исполнитель, рефлексия.

2026-02-25

Глава 7 — Промпт-инжиниринг как ремесло

Седьмой пост разбора LLM Primer I по главам. Четыре паттерна промптов, которые несут основную нагрузку — system prompt, few-shot, цепочка размышления, роль — и почему каждый из них работает, в свете механизма следующего токена.

2026-02-24

Глава 6 — Безопасность, выравнивание, и что значит «быть полезным»

Шестой пост разбора LLM Primer I по главам. Почему связность и полезность — разные вещи, что именно настраивает выравнивание, и предварительный взгляд на новую секцию §6.6 издания 2026 года — конституционный ИИ, модели на основе дебатов, и свежие направления исследований.

2026-02-23