Введение в LLM

Эта страница предоставляет понятное руководство по большим языковым моделям (LLM), от основ до приложений для любителей ИИ.


Всего доступно 13 статей. | Текущая страница 1 из 1.

Глава 14 — Бенчмаркинг, тестирование и производительность

Пятнадцатый и финальный пост поглавного разбора LLM Primer IV. MCP-Universe Benchmark на реальных серверах, два системных режима отказа, которые он раскрыл, десятикратный разрыв пропускной способности между session-per-request и пулом сессий, и мост к тому V.

2026-04-12

Глава 10 — Память для долгих задач

Десятый пост поглавного разбора LLM Primer IV. Краткосрочная память через окна и ReAct-черновики, долгосрочная память через эпизодические векторы и семантические хранилища, и техники сжатия, держащие агента продуктивным часами и днями.

2026-04-08

Глава 9 — Управление бюджетом внимания

Девятый пост поглавного разбора LLM Primer IV. Context rot, обрыв lost-in-the-middle, tool-loadout rot и три архитектурных ответа — MCP, RAG, дообучение — на вопрос, где на самом деле живёт недостающее знание модели.

2026-04-07

Глава 8 — Архитектурные раскладки развёртывания

Восьмой пост поглавного разбора LLM Primer IV. Три раскладки развёртывания, проявившиеся в MCP-экосистеме — reusable agent, strict purity, hybrid, — и четыре связывающих ограничения, определяющих, какая подходит какому проекту.

2026-04-06

Глава 1 — Кризис интеграций ИИ и подъём агентной архитектуры

Первый пост поглавного разбора LLM Primer IV. Почему монолитные агенты распадаются по мере роста системных промптов, проблема интеграций N на M, скрытая под этим, и переход от prompt engineering к context engineering, под который и был построен MCP.

2026-03-30

Глава 8 — Анонимизация данных в RAG-пайплайне

Восьмой пост разбора LLM Primer III. Анонимизация до генерации против после, три семейства техник — маскирование, синтетическая замена, дифференциальная приватность — и компромисс полезность–приватность, определяющий, остаётся ли система вообще полезной.

2026-03-25

Глава 7 — Реализация контроля доступа

Седьмой пост разбора LLM Primer III. Документ-уровневые ACL как фундамент, RBAC с метками чувствительности Microsoft Purview, ReBAC с Zanzibar и SpiceDB и дисциплина pre-filter против post-filter, работающая под всеми ними.

2026-03-24

Глава 5 — Архитектура поискового пайплайна

Пятый пост разбора LLM Primer III. Почему одиночный векторный поиск — это не пайплайн: гибридный поиск, reciprocal rank fusion, cross-encoder reranking и переписывание запроса и HyDE, собранные в продакшен-архитектуру, к которой сходятся зрелые RAG-системы.

2026-03-22

Глава 4 — Выбор подходящей векторной базы данных

Четвёртый пост разбора LLM Primer III. Архитектурный раздел между специализированными векторными базами и расширениями вроде Postgres, лидеры managed-сегмента (Pinecone, Vertex), open-source поле (Qdrant, Milvus, Weaviate), встраиваемые опции и три операционные оси — резидентность, ops, стоимость, на которых решается реальный выбор.

2026-03-21

Глава 1 — Эволюция архитектуры RAG

Первый пост разбора LLM Primer III. Четыре архитектурные позы RAG — Naive, Advanced, Modular, Agentic — читаются как история о передаче LLM всё большей агентности по одному решению за раз, и честный ответ на вопрос, когда дообучение лучше поиска.

2026-03-18

LLM Primer III — Введение в серию и оглавление

Открываем поглавный разбор третьей книги серии LLM Primer — Корпоративный ИИ с RAG. Почему retrieval-augmented generation выглядит просто снаружи и состоит из стопки дисциплин внутри, для кого эта книга и расписание одиннадцати постов с 18 по 28 марта.

2026-03-17

Глава 3 — Как текст течёт внутри модели

Третий пост разбора LLM Primer I по главам. Как меняется токен внутри модели — эмбеддинги, внимание, трансформер — без матриц, но без потери точности.

2026-02-20

LLM Primer I — разбор по главам: вступление и оглавление

Вступление к серии глав-разборов LLM Primer I. Как устроена сама книга, что даёт каждая глава, и расписание двенадцати постов между 18 февраля и 1 марта.

2026-02-17