Введение в LLM
Эта страница предоставляет понятное руководство по большим языковым моделям (LLM), от основ до приложений для любителей ИИ.
Глава 14 — Бенчмаркинг, тестирование и производительность
Пятнадцатый и финальный пост поглавного разбора LLM Primer IV. MCP-Universe Benchmark на реальных серверах, два системных режима отказа, которые он раскрыл, десятикратный разрыв пропускной способности между session-per-request и пулом сессий, и мост к тому V.
2026-04-12Глава 1 — Кризис интеграций ИИ и подъём агентной архитектуры
Первый пост поглавного разбора LLM Primer IV. Почему монолитные агенты распадаются по мере роста системных промптов, проблема интеграций N на M, скрытая под этим, и переход от prompt engineering к context engineering, под который и был построен MCP.
2026-03-30Глава 4 — Выбор подходящей векторной базы данных
Четвёртый пост разбора LLM Primer III. Архитектурный раздел между специализированными векторными базами и расширениями вроде Postgres, лидеры managed-сегмента (Pinecone, Vertex), open-source поле (Qdrant, Milvus, Weaviate), встраиваемые опции и три операционные оси — резидентность, ops, стоимость, на которых решается реальный выбор.
2026-03-21Глава 2 — Интеллектуальный парсинг документов
Второй пост разбора LLM Primer III. Почему PDF — это не текстовый файл, что на самом деле сохраняют парсеры с учётом макета, текущий ландшафт инструментов (LlamaParse, Docling, Unstructured, Marker-PDF, Firecrawl, DeepSeek-OCR) и мультимодальный трек, ищущий по изображениям страниц напрямую.
2026-03-19Глава 11 — Оценка, калибровка и вывод
Одиннадцатый пост разбора LLM Primer II: Language Models Through Mathematics по главам. Глава, в которой мы задаёмся вопросом: как вообще измерить машину, способную сказать что угодно — и обнаруживаем, что уверенная модель часто оказывается плохо откалиброванной.
2026-03-13Глава 4 — Как модель обучается
Четвёртый пост разбора LLM Primer I по главам. Почему предобучение задаёт потолок способностей, почему fine-tuning лепит характер, и как RLHF превращает простого предсказателя токенов в того ассистента, которому мы доверяем ежедневно.
2026-02-21