Глава 7 — Промпт-инжиниринг как ремесло

Седьмой пост разбора LLM Primer I: How Generative AI Works по главам. Один из самых практичных — те приёмы, которые делают одну и ту же модель раза в два умнее, и почему они работают.

Почему промпт — это не «просто вопрос»

«Промпт-инжиниринг» звучит иногда пафосно. Будто речь о том, чтобы складно сформулировать вопрос. Но я в книге настаиваю на более уважительной интерпретации: промпт — это то, что задаёт контекст, в котором модель будет предсказывать каждый следующий токен. А это уже немало.

Модель читает всё, что есть у неё в контексте, и поверх этого собирает распределение следующего токена. Промпт — центральная часть этого контекста. Менять тон, структуру, примеры, роль — значит разом сдвигать распределение всех токенов, которые пойдут дальше.

В этой оптике промпт-инжиниринг — самый дешёвый способ выжать из модели её способности и самый гибкий способ радикально менять поведение, не меняя саму модель.

Если коротко: промпт — это не «вопрос». Это контекст — а контекст диктует форму распределения, из которого тянется каждый следующий токен.

Четыре паттерна, выдерживающих нагрузку

В главе 7 я отбираю четыре паттерна, которые на практике несут основную нагрузку. Есть и другие. Но именно эти четыре — рабочие лошади.

System prompt. Инструкция, задающая тон и границы роли модели с самого начала. Всё, что идёт после, генерируется внутри этого контекста. Поправить пару строк в system prompt часто означает переписать характер ассистента, не меняя ничего больше.

Few-shot. Вместо того чтобы описывать желаемый тип ответа, показать два-три примера прямо в контексте. Модель воспринимает эти примеры как «локальный образец вывода» и подгоняет своё распределение к ним. Два конкретных примера часто весят больше страницы абстрактных описаний.

Цепочка размышления (chain of thought). Попросить модель: «не давай только заключение; покажи шаги рассуждения». На вид мелочь — эффект большой. Записывая шаги в собственный контекст, модель сама расширяет контекст — и каждый следующий токен уже учитывает эти шаги.

Роль. Сказать «вы — старший бэкенд-инженер» означает вытянуть из распределения предобучения ту палитру ответов, которая появляется, когда пишут старшие бэкенд-инженеры. Меняется не только тон; меняется семантическая почва, на которой стоит модель.

Почему эти паттерны работают

В книге я свожу все четыре к одному и тому же: модель впитывает контекст и генерирует поверх него следующий токен. System prompt задаёт большую раму, few-shot сужает форму, цепочка размышления даёт модели расширить собственный контекст, роль вызывает семейство ответов из предобучения.

Когда это устаканится, на любой новый паттерн промпта вы сможете дать механически обоснованную оценку — сработает он или нет. Это шаг от «учу рецепты» к «понимаю почему».

Стоит запомнить: хороший промпт не создаёт у модели способности, которой у неё нет. Он вызывает из того, что в модели уже есть, наиболее подходящий к задаче кусок.

Что работает, а что переоценено

В концовке главы я честно разделяю, что даёт реальный эффект, а что переоценено. Не все паттерны промпта одинаково сильны. Какие-то по-настоящему поднимают модель на ступень выше, другие — погромче по виду, чем по результату.

Иметь эту карту полезно — чтобы вкладывать своё время в те паттерны, которые действительно подтягивают модель.

Нить Главы 7

Что остаётся: одна и та же модель в разных контекстах — это разные модели. Научиться управлять контекстом — самый дешёвый, и часто самый эффективный, способ получить то, что нужно. Прежде чем переходить на более дорогую модель, стоит проверить, не решат ли проблему правки контекста.

Завтра — Глава 8: Когда одной модели мало — инструменты и агенты. Уходим из «одна модель, один ответ» и заходим на территорию, где модель обретает руки. Вызов функций, агенты, и новый §8.6 с паттернами агентов.

Хочется всю картину? Книга собирает паттерны и стоящие за ними механизмы в одно место — с конкретными примерами. Открыть LLM Primer I на Amazon →