ChatGPT на каждый день: 333 промта для бизнеса и маркетинга — страница 33 из 36

В ChatGPT 4 (версия Turbo) есть встроенная модель text to image (создание иллюстрации по заданному промту) DALL-E 3, которая позволяет создавать нейроиллюстрации, нейрофотографии, чертежи, схемы, обложки, баннеры, элементы оформления и даже инфографики и эскизы лендингов прямо в ChatGPT.

DALL-E 3 не единственный подобный сервис, есть еще Midjourney, Leonardo, Stable Diffusion, отечественные «Кандинский», «Шедеврум» и др. Лидерами по качеству генерации, художественной выверенности, количеству стилей являются Midjourney (в особенности версия 6) и DALL-E 3.

Уровень иллюстраций, которые создают нейросети, крайне высок и практически не уступает по основным художественным характеристикам работам профессиональных иллюстраторов. Более того, я проводил небольшой эксперимент: в своих Instagram Stories разместил 10 нейроиллюстраций, сгенерированных по моим промтам, и 10 иллюстраций, созданных топовыми мировыми иллюстраторами. Правильно угадали 47 % людей – если бы они кидали монетку, результат был бы выше. То есть нейроиллюстрации ни в чем не уступают профессиональным иллюстрациям, и большинство людей не могут отличить одни от других.

Принципы работы с нейроиллюстрациями в ChatGPT

Перед тем как перейти к промтам, я хотел бы озвучить несколько правил и особенностей работы с иллюстрациями в DALL-E 3.

1. DALL-E 3, как и любая другая подобная система, довольно плохо работает с текстами на изображениях. С русским языком не работает вовсе, с английским, как правило, с опечатками. Поэтому рекомендую всегда ставить промт: «Не используй текст в иллюстрации, только визуальные элементы». Иногда он может настойчиво пытаться вставить текст, в этом случае даем ему коррекционный промт: «Пересоздай эту же иллюстрацию».

2. Также из-за этого ограничения он не может нарисовать полноценную инфографику или макет лендинга с правильными текстами, поэтому в обоих случаях мы можем использовать полученные иллюстрации как референсы.

3. По умолчанию DALL-E 3 подбирает стиль, который считает наиболее подходящим для данного контекста. Однако вы можете давать ему любые указания по стилю, например:

● Стиль конкретного художника: «пейзаж в стиле Эдварда Хоппера» либо «фотография в стиле Хельмута Ньютона».

● Направление живописи или фотографии: «стритстайл-фото», «современная иллюстрация», «импрессионистский натюрморт», «портрет в киберпанк-стилистике».

● Художественные эпохи: «комната в стиле эпохи барокко», «советский конструктивизм», «иллюстрация в стиле 1960-х».

● Любые другие референсы: «супергеройские комиксы», «стиль детского рисунка», «книжная иллюстрация», «гравюра», «узор ковра».

4. Подчеркну, что нейроиллюстрацию, как и другие форматы, мы рассматриваем в контексте бизнеса. И удачно подобранный стиль позволит добавить эмоциональности и больше цеплять взгляды пользователей в формате креативов таргетированной рекламы, элементов оформления социальных сетей, иллюстраций к постам и статьям.

5. В треде с любой генерацией (например, написания поста для VK) вы можете дать мини-промт «Нарисуй иллюстрацию к созданному тобой посту/объявлению/эссе/идее/отчету». В этом случае вам не понадобится детализировать и дополнять промт, он сам подберет главную идею, подходящие стилистику, композицию, цветовые решения, причем, как правило, сделает это довольно удачно.

6. Как и у любой другой модели text to image, у DALLE-3 есть элементы, при создании которых ей свойственно допускать ошибки. В частности:

● Прорисовка конечностей и других частей тела (да, у человека иногда может быть шесть пальцев или три ключицы).

● Действия, связанные с мелкой моторикой (например, игра в шахматы или письмо авторучкой).

● Лица в толпе – при большом количестве людей на иллюстрации у кого-нибудь лицо окажется смазанным либо «съедут» черты лица.

● Сложно устроенные предметы, с большим количеством деталей – например, саксофон, с огромным количеством клапанов, клавиш и других элементов.

С каждым новым обновлением процент брака все ниже, но примерно в 15 % генераций они все же встречаются. У всех этих огрехов есть свои глубинные причины. Например, DALLE-3 чаще путается с пальцами, нежели с чертами лица, поскольку лица чаще, чем пальцы, фигурируют на фотографиях и картинах, на которых он обучается. А значит, «база референсов» по лицам у него больше, и это влияет на точность. Здесь хочу дать ту же рекомендацию, что и в случае с ChatGPT: вместо того, чтобы махнуть рукой и раздраженно сказать «Бестолковый, не можешь с шахматами справиться», просто регенерируйте бракованный вариант. Помните, что альтернатива нейросетям – заказать иллюстрацию у профессионального иллюстратора (стоимость одной иллюстрации составляет примерно 40 000 рублей) либо 5 лет обучения в художественном вузе, чтобы рисовать на таком уровне самостоятельно. Так что потеря 40 секунд на регенерацию – довольно выгодный вариант, как ни крути.

Как правило, повторные генерации дают исправленный вариант. В частности, поможет коррекционный промт: «Перерисуй эту же иллюстрацию, однако проследи, чтобы у человека было 5 пальцев».

7. Ни от одной существующей на сегодняшний день модели для генерации изображений невозможно добиться точного соблюдения композиции (во всяком случае с первого раза). Если вы укажете, что на столе должно быть 7 карандашей, стакан, наполовину полный апельсиновым соком, а голова главного персонажа должна быть повернута налево на 30 градусов – скорее всего, на иллюстрации будут карандаши, стакан (и, конечно же, голова), но детали могут отличаться. При этом главная идея иллюстрации, скорее всего, будет схвачена правильно. Поэтому при составлении промта нет особого смысла уходить в детали.

В качестве альтернативы можно использовать Midjourney, там есть специальные техники редактуры (параметр Vary (Region)) для корректировки деталей.

8. Если же иллюстрация отличается от задуманной по существенным деталям, можно дать коррекционный промт с описанием изменений, например: «Перерисуй эту же иллюстрацию, перенеси действие в лес и добавь закатное солнце».

9. Большинство промтов в этой главе направлены на создание иллюстраций, однако если есть задача создать нейрофото, то необходимо заменить слово «иллюстрация» на «фотография» и добавить элемент: «Сделай фото максимально реалистичным, в высоком разрешении».

Создаем нейроиллюстрации

Общая формула промта для создания нейроиллюстрации выглядит следующим образом:

1. Ролевой промт. Подумайте, кто обычно занимается иллюстрациями, подобными той, которая необходима. Примеры: иллюстратор, бренд-дизайнер, дизайнер социальных сетей.

2. Сюжет и композиция. Например: отец с сыном играют в футбол на поле (такой сюжет может быть использован для рекламы спортивной школы для детей).

3. Необходимые размеры (соотношение сторон или размер в пикселях). По умолчанию DALL-E рисует квадратную иллюстрацию.

4. Формат: иллюстрация, фото, чертеж, карандашный набросок, инфографика.

5. Референсы по стилю: реалистичная иллюстрация, в стиле китайской каллиграфии, в поп-арт-стиле.

6. Дополнения: предзакатное время суток, эмоционально, темные цвета, теплый свет.

Далее я приведу ряд примеров использования этого шаблона для конкретных задач.

Начнем с универсального метапромта для работы с DALL-E 3.

1. Создаем метапромт для генерации изображений

Метапромт – понятие в промт-инжиниринге, характеризующее промт, с помощью которого нейросеть сама создает нужный нам промт под конкретную задачу. Расшифрую. Мы можем дать ChatGPT основную идею иллюстрации, и он подготовит подробный промт для DALLE-3, учитывающий множество деталей, характеристик стиля и т. д. И по этому промту DALL-E 3 нарисует иллюстрацию.

Ты – промт-инженер:: Твоя задача – создать следующую иллюстрацию: [описываем идею иллюстрации, например: «альпинисты завтракают в горах»]:: Напиши подробный промт для DALLE-3, укажи детали композиции, проработай художественные особенности, опиши стилистику, атмосферу и настроение иллюстрации.

После того как промт будет написан, DALLE-3 сразу же нарисует иллюстрацию. Она будет отличаться детальной проработкой и стилистической выверенностью.

Иллюстрация практически идеальна (жаль, что черно-белая печать не передает деталей горного альпийского света и его отблесков), за исключением, возможно, апельсина у лап собаки.

Может возникнуть вопрос: а зачем тогда самим писать какие-либо промты, если ChatGPT с этим справляется? В первую очередь для того, чтобы DALL-E 3 учитывал наши пожелания, акценты, стиль, который мы передаем через промты. Если же особых пожеланий нет, то это вполне рабочая схема создания эффектных иллюстраций.


2. Создаем иллюстрацию к посту

С этим промтом нам не нужно подробно описывать требования к иллюстрации, ChatGPT подберет сюжет и стилистику самостоятельно. Если результат по каким-то причинам вас не устроит, просто напишите «нарисуй еще одну», при необходимости уточните необходимые корректировки, например: «сделай иллюстрацию реалистичнее и светлее» или «добавь эмоциональности».

Ты – профессиональный иллюстратор:: Создай иллюстрацию к посту, который я пришлю следом:: Иллюстрация будет опубликована в социальных сетях, размер иллюстрации 1:1:: Иллюстрация должна отражать основные идеи поста в визуальном формате, должна быть выполнена в стиле лучших примеров журнальной иллюстрации:: Не используй текст в иллюстрации, только визуальные элементы.

Следующим сообщением присылаем текст поста.

3. Создаем иконку для сайта

Ты – профессиональный веб-дизайнер:: Создай иконку для сайта с изображением [описание изображения, например: «лупы»]:: Иконка должна быть двухцветной: [описание цветов, например: «сине-белой»], размер 1:1, flat design.