Введение в LLM
Эта страница предоставляет понятное руководство по большим языковым моделям (LLM), от основ до приложений для любителей ИИ.
Глава 10 — Ведущие фреймворки оценки
Десятый пост разбора LLM Primer III. Полевой путеводитель по фреймворкам, превращающим Триаду оценки в нечто, что команда способна реально гонять — RAGAS, TruLens, DeepEval с одной стороны, Braintrust, LangSmith, Phoenix, Galileo, Opik с другой, и Evaluation Gap, которую ни один пока не закрыл.
2026-03-27Глава 9 — Триада оценки RAG
Девятый пост разбора LLM Primer III. RAG-система может отказывать в трёх разных местах, а отказы снаружи неразличимы. Триада оценки — релевантность контекста, верность и релевантность ответа — это малый словарь, не дающий чинить одну ошибку, измеряя другую.
2026-03-26LLM Primer III — Введение в серию и оглавление
Открываем поглавный разбор третьей книги серии LLM Primer — Корпоративный ИИ с RAG. Почему retrieval-augmented generation выглядит просто снаружи и состоит из стопки дисциплин внутри, для кого эта книга и расписание одиннадцати постов с 18 по 28 марта.
2026-03-17