Глава 7 — Промпт-инжиниринг как ремесло
Седьмой пост разбора LLM Primer I: How Generative AI Works по главам. Один из самых практичных — те приёмы, которые делают одну и ту же модель раза в два умнее, и почему они работают.
Почему промпт — это не «просто вопрос»
«Промпт-инжиниринг» звучит иногда пафосно. Будто речь о том, чтобы складно сформулировать вопрос. Но я в книге настаиваю на более уважительной интерпретации: промпт — это то, что задаёт контекст, в котором модель будет предсказывать каждый следующий токен. А это уже немало.
Модель читает всё, что есть у неё в контексте, и поверх этого собирает распределение следующего токена. Промпт — центральная часть этого контекста. Менять тон, структуру, примеры, роль — значит разом сдвигать распределение всех токенов, которые пойдут дальше.
В этой оптике промпт-инжиниринг — самый дешёвый способ выжать из модели её способности и самый гибкий способ радикально менять поведение, не меняя саму модель.
Четыре паттерна, выдерживающих нагрузку
В главе 7 я отбираю четыре паттерна, которые на практике несут основную нагрузку. Есть и другие. Но именно эти четыре — рабочие лошади.
System prompt. Инструкция, задающая тон и границы роли модели с самого начала. Всё, что идёт после, генерируется внутри этого контекста. Поправить пару строк в system prompt часто означает переписать характер ассистента, не меняя ничего больше.
Few-shot. Вместо того чтобы описывать желаемый тип ответа, показать два-три примера прямо в контексте. Модель воспринимает эти примеры как «локальный образец вывода» и подгоняет своё распределение к ним. Два конкретных примера часто весят больше страницы абстрактных описаний.
Цепочка размышления (chain of thought). Попросить модель: «не давай только заключение; покажи шаги рассуждения». На вид мелочь — эффект большой. Записывая шаги в собственный контекст, модель сама расширяет контекст — и каждый следующий токен уже учитывает эти шаги.
Роль. Сказать «вы — старший бэкенд-инженер» означает вытянуть из распределения предобучения ту палитру ответов, которая появляется, когда пишут старшие бэкенд-инженеры. Меняется не только тон; меняется семантическая почва, на которой стоит модель.
Почему эти паттерны работают
В книге я свожу все четыре к одному и тому же: модель впитывает контекст и генерирует поверх него следующий токен. System prompt задаёт большую раму, few-shot сужает форму, цепочка размышления даёт модели расширить собственный контекст, роль вызывает семейство ответов из предобучения.
Когда это устаканится, на любой новый паттерн промпта вы сможете дать механически обоснованную оценку — сработает он или нет. Это шаг от «учу рецепты» к «понимаю почему».
Что работает, а что переоценено
В концовке главы я честно разделяю, что даёт реальный эффект, а что переоценено. Не все паттерны промпта одинаково сильны. Какие-то по-настоящему поднимают модель на ступень выше, другие — погромче по виду, чем по результату.
Иметь эту карту полезно — чтобы вкладывать своё время в те паттерны, которые действительно подтягивают модель.
Нить Главы 7
Что остаётся: одна и та же модель в разных контекстах — это разные модели. Научиться управлять контекстом — самый дешёвый, и часто самый эффективный, способ получить то, что нужно. Прежде чем переходить на более дорогую модель, стоит проверить, не решат ли проблему правки контекста.
Завтра — Глава 8: Когда одной модели мало — инструменты и агенты. Уходим из «одна модель, один ответ» и заходим на территорию, где модель обретает руки. Вызов функций, агенты, и новый §8.6 с паттернами агентов.