Введение в LLM
Эта страница предоставляет понятное руководство по большим языковым моделям (LLM), от основ до приложений для любителей ИИ.
Глава 14 — Бенчмаркинг, тестирование и производительность
Пятнадцатый и финальный пост поглавного разбора LLM Primer IV. MCP-Universe Benchmark на реальных серверах, два системных режима отказа, которые он раскрыл, десятикратный разрыв пропускной способности между session-per-request и пулом сессий, и мост к тому V.
2026-04-12Глава 13 — Фреймворки и облачная интеграция
Четырнадцатый пост поглавного разбора LLM Primer IV. Strands с Bedrock, AWS state-layer-паттерн, Microsoft Agent Framework, LangChain, Semantic Kernel — и три продакшен-формы интеграции, к которым команды приходят независимо.
2026-04-11Глава 10 — Память для долгих задач
Десятый пост поглавного разбора LLM Primer IV. Краткосрочная память через окна и ReAct-черновики, долгосрочная память через эпизодические векторы и семантические хранилища, и техники сжатия, держащие агента продуктивным часами и днями.
2026-04-08Глава 6 — Фундаментальные стратегии оркестрации
Шестой пост поглавного разбора LLM Primer IV. Две базовые формы оркестрации — последовательные пайплайны и параллельный scatter-gather — и предварительный вопрос, который должна задать каждая команда: является ли мультиагентная система вообще правильным ответом?
2026-04-04Глава 11 — Непрерывные обновления и оптимизация пайплайна
Одиннадцатый и заключительный пост разбора LLM Primer III. CDC и инкрементальная индексация держат корпус свежим, семантическое кеширование и тиринг моделей держат латентность низкой, а четырёхстадийная петля обратной связи закрывает разрыв между тем, что продакшен говорит команде, и тем, что команда реально меняет — плюс мост в Том IV про Model Context Protocol.
2026-03-28Глава 10 — Ведущие фреймворки оценки
Десятый пост разбора LLM Primer III. Полевой путеводитель по фреймворкам, превращающим Триаду оценки в нечто, что команда способна реально гонять — RAGAS, TruLens, DeepEval с одной стороны, Braintrust, LangSmith, Phoenix, Galileo, Opik с другой, и Evaluation Gap, которую ни один пока не закрыл.
2026-03-27Глава 5 — Архитектура поискового пайплайна
Пятый пост разбора LLM Primer III. Почему одиночный векторный поиск — это не пайплайн: гибридный поиск, reciprocal rank fusion, cross-encoder reranking и переписывание запроса и HyDE, собранные в продакшен-архитектуру, к которой сходятся зрелые RAG-системы.
2026-03-22Глава 4 — Выбор подходящей векторной базы данных
Четвёртый пост разбора LLM Primer III. Архитектурный раздел между специализированными векторными базами и расширениями вроде Postgres, лидеры managed-сегмента (Pinecone, Vertex), open-source поле (Qdrant, Milvus, Weaviate), встраиваемые опции и три операционные оси — резидентность, ops, стоимость, на которых решается реальный выбор.
2026-03-21Глава 3 — Продвинутые фреймворки чанкинга
Третий пост разбора LLM Primer III. Спектр чанкинга от фиксированного размера до учёта структуры, миф об overlap, обрыв контекста, тихо разрушающий поиск, и техники contextual retrieval и late chunking, переписавшие фронтир.
2026-03-20Глава 2 — Интеллектуальный парсинг документов
Второй пост разбора LLM Primer III. Почему PDF — это не текстовый файл, что на самом деле сохраняют парсеры с учётом макета, текущий ландшафт инструментов (LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR) и мультимодальный трек, ищущий по изображениям страниц напрямую.
2026-03-19Глава 1 — Эволюция архитектуры RAG
Первый пост разбора LLM Primer III. Четыре архитектурные позы RAG — Naive, Advanced, Modular, Agentic — читаются как история о передаче LLM всё большей агентности по одному решению за раз, и честный ответ на вопрос, когда дообучение лучше поиска.
2026-03-18LLM Primer III — Введение в серию и оглавление
Открываем поглавный разбор третьей книги серии LLM Primer — Корпоративный ИИ с RAG. Почему retrieval-augmented generation выглядит просто снаружи и состоит из стопки дисциплин внутри, для кого эта книга и расписание одиннадцати постов с 18 по 28 марта.
2026-03-17Глава 11 — Оценка, калибровка и вывод
Одиннадцатый пост разбора LLM Primer II: Language Models Through Mathematics по главам. Глава, в которой мы задаёмся вопросом: как вообще измерить машину, способную сказать что угодно — и обнаруживаем, что уверенная модель часто оказывается плохо откалиброванной.
2026-03-13Глава 9 — RAG: сшиваем свежую информацию в контекст
Девятый пост разбора LLM Primer I по главам. Что на самом деле делает RAG (Retrieval-Augmented Generation), как он подпирает чувство времени и фактическую точность модели, и где начинается разница между хорошим и плохим RAG.
2026-02-26