Вчера потратил сорок минут на промпт для аватарки. Сорок. Минут. Пробовал «красивый человек в очках с кофе», потом «портрет мужчины 30 лет в очках и с кофе», добавил стилистику, детали, параметры качества — и всё равно вышло что-то странное: лицо как с плаката 90-х, фон из фэнтези.
Это знакомая история для тех, кто хоть раз открывал Midjourney или Stable Diffusion с мыслью «напишу простой запрос, получу красивую картинку». Не получается. Или получается, но совсем не то, что видел в голове.
Я провёл апрель, гоняя разные модели — Midjourney, DALL-E 3, Stable Diffusion XL, Flux — и выработал несколько рабочих приёмов. Не универсальных правил, а конкретных вещей, которые реально влияют на результат.
Начни не с картинки, а с задачи
Хороший промпт начинается не с описания визуала, а с вопроса: зачем мне это изображение? Звучит банально, но именно этот шаг убирает большую часть «а что не так?» в процессе.
Допустим, тебе нужна иллюстрация для поста в телеграме. Ты уже знаешь несколько вещей: формат — соцсети, размер скорее всего маленький, картинка должна читаться быстро, нужно определённое настроение. Всё это влияет на промпт.
Если просто написать «красивая девушка в парке», модель выдаст что угодно — от фотореалистичного портрета до аниме. Без контекста у неё слишком много вариантов.
Поэтому перед тем как писать — определи три вещи: формат (иллюстрация, фото, иконка), стилистику (реализм, минимализм, гранж) и эмоцию (позитивная, тревожная, спокойная).
Структура работает лучше, чем поток
Когда я только начинал, писал промпты как длинные предложения: «красивая девушка сидит в кафе и пьёт кофе окно дождь на улице тёплый свет». Модель понимает такой стиль, но результат получается средним.
Дело в том, что структурированный подход заметно поднимает качество. Я разделяю промпт на несколько блоков.
Субъект — что или кто в центре. Не «человек», а «мужчина лет сорока в кожаной куртке». Не «животное», а «рыжий кот мейн-кун сидит на подоконнике».
Окружение — где это происходит. Этот блок важен, потому что большинство нейросетей охотно «заполняют» фон деталями — и если не указать фон, он будет случайным.
Стиль — ключевой параметр. Я обычно пишу «cinematic photography», «flat vector illustration», «oil painting style», «grainy film photography». Без стиля нейросеть выбирает сама, и чаще всего это усреднённый красивый вариант без характера.
Освещение и настроение — часто недооценённый блок. «Тёплый закатный свет», «неоновые блики», «мягкий рассеянный свет из окна» — эти слова реально меняют результат. Проверял: один и тот же субъект с разным описанием света даёт совершенно разные картинки.
Технические параметры — разрешение, соотношение сторон, отсутствие артефактов. В Midjourney это что-то вроде --ar 16:9 --style raw --v 6.1.
Это не жёсткая схема, которой нужно следовать буквально. Я просто начал мыслить в этих категориях — и промпты стали выходить осознаннее.
Негативные промпты — недооценённый инструмент
Долгое время я их игнорировал. Казалось — зачем уточнять, чего не хочу, это же лишние слова. Потом попробовал на Stable Diffusion и понял: это как минимум половина результата.
Мой стандартный негативный промпт, который иду почти всегда: «low quality, blurry, distorted, deformed, oversaturated, watermark, text, logo». Убирает типичные артефакты, которые нейросети любят подбрасывать.
Можно пойти дальше. Нужен чистый минималистичный стиль — добавляю «clutter, busy background, noise, realistic photo textures». Для портретов обязательно пишу «extra fingers, deformed face, asymmetry» — эти проблемы вылезают чаще, чем хочется.
На практике негативный промпт не заменяет описание, а дополняет его. Это фильтр, не основа.
Итерации — это нормально
Самая частая ошибка в начале: один промпт — один результат. Написал, посмотрел, расстроился, бросил.
Рабочий процесс выглядит иначе. Берёшь результат, смотришь что именно не так: слишком тёмный фон, неправильная поза, кривое лицо, стиль не тот. И в следующем промпте меняешь конкретную деталь. Три-четыре итерации — норма, не исключение.
В Midjourney помогает параметр --cref (character reference) — можно взять удачный вариант и доработать, сохранив персонажа. В DALL-E 3 это работает иначе, но принцип тот же: первый результат — это черновик, который ты улучшаешь, а не финальная картинка из головы.
Кстати, есть один приём: описания в скобках () усиливают влияние элемента, в квадратных [...] — ослабляют. В Midjourney это работает как веса. (white cat)[dog] — больше внимания к белому коту, меньше к собаке.
Стилистические референсы — без стеснения
Когда пишешь «в стиле Уэса Андерсона», нейросеть действительно понимает: характерная симметрия, цветовая палитра, композиция. Но это работает только если ты сам знаешь, как выглядит этот стиль.
Я использую два подхода. Первый — называю напрямую: «в стиле Рембрандта», «как на иллюстрациях National Geographic», «в духе японской гравюры укиё-э». Второй — даю конкретное описание: «тёплая цветовая палитра, центральная композиция, мягкий фокус, как на старых снимках Polaroid».
Второй подход часто надёжнее. Нейросеть не всегда знает узкие стили, зато «приглушённые тона», «резкие тени» и «высокий контраст» понимает как прямые визуальные инструкции.
Что я понял за месяц практики
Промпты — это не магия и не точная наука. Это разговор с моделью: ты переводишь образ из головы в текст, модель интерпретирует текст по-своему. Чем точнее текст, тем ближе результат к задумке. Но точный — не значит длинный. Короткий промпт с правильно подобранными словами часто работает лучше, чем простыня.
Несколько наблюдений, которые упростили мне жизнь.
Если нужна определённая композиция — пишу «wide shot», «close-up portrait», «birds eye view». Надёжнее любых длинных описаний.
Для текста на картинке DALL-E 3 справляется лучше всех остальных. Нужен плакат или надпись — сначала иду туда.
Китайские иероглифы в промпте иногда дают интересный результат — стилизацию под азиатскую эстетику, которую словами описать сложно. Экспериментирую, когда нужен нестандартный стиль.
И последнее: сохраняй удачные промпты. У меня Notion-таблица с названием, параметрами и результатом. Через месяц накапливается библиотека рабочих формул под разные задачи — это реально экономит время.
Написать хороший промпт — это навык. Не талант и не магия, а навык, который прокачивается практикой. Как и всё остальное в работе с текстом, впрочем.
