Способность современных сервисов искусственного интеллекта генерировать изображения хорошо известна и остается одним из наиболее распространенных вариантов использования таких платформ, как ChatGPT. В то же время данная сфера сопровождается значительным количеством споров. Фотографы, художники и кинематографисты выразили недовольство тем, что OpenAI и другие компании обучают свои модели на их работах, защищенных авторским правом.
В этом материале собраны практические советы, как работать с системой и получать лучшие результаты.
Создание изображений на основе текстовых запросов
Самая очевидная особенность — возможность создать совершенно новое изображение на основе текстового описания. Просто введите запрос типа «создать изображение двух кроликов, играющих на лугу» или «создать фотореалистичное изображение женщины, сидящей перед компьютером и пьющей кофе из чашки с надписью «ПК для всех», и система сгенерирует версию, которую вы сможете скачать и использовать.
Некоторые из сгенерированных изображений довольно высокого качества. Другие могут не соответствовать описанию или содержать очевидные ошибки. Современные модели реже генерируют графики с избыточными конечностями или неправильной анатомией, но значительные ошибки все же случаются.
В случае неудовлетворительного результата вы можете либо продолжить работу в том же чате, уточняя запрос, либо создать новый или измененный запрос. Эффективность зависит от ситуации. На практике небольшие изменения не всегда дают существенное улучшение, а так называемое оперативное проектирование не имеет устойчивой формулы успеха. Даже минимальное логическое уточнение типа «у одной криль розовый ошейник» или «она держит чашку в левой руке» может полностью изменить композицию или, наоборот, придать желаемую точность.
Пять советов по созданию лучших изображений с помощью ChatGPT
-
Четко опишите желаемое
Если есть четкое представление о желаемом изображении, стоит максимально понятно его объяснить. Фраза типа «девушка с темными волосами и светлой кожей, сидящая за пианино в старом доме со старой мебелью» передает идею точнее, чем общая фраза вроде «девушка играет на пианино». При отсутствии четкого видения система также не сможет дать точный результат. -
Не перегружайте описание
Детали важны, но слишком много деталей приводит к потере целостности запроса. Очень большой объем текста со слишком подробным описанием увеличивает вероятность получения неподходящего результата. Стоит описать главное, предоставив системе возможность заполнить мелкие детали. -
Заранее уточняйте технические параметры
Полезно указать формат и стиль: вертикальное или квадратное изображение, фотография или картина, насыщенные или приглушенные цвета, теплое или холодное освещение, доминирование объекта на переднем плане и т. д. Важно описать не только содержание, но и способ исполнения. -
Повторить попытки
Если результат не соответствует ожиданиям, вы можете попросить систему создать дополнительные параметры или изменить запрос. Вы можете попробовать повысить уровень детализации или, наоборот, упростить описание. -
Использовать миниатюру
Если есть возможность нарисовать простой эскиз композиции, вы можете попросить систему превратить его в готовое изображение в нужном стиле. Качество сильно зависит от сюжета и сложности, случаются ошибки, в том числе неправильные направления взгляда или нелогичные позы.
Редактирование и улучшение ваших собственных изображений
Помимо создания новых изображений, ChatGPT позволяет редактировать существующие. Важно отметить, что технически это не классический монтаж. Каждое изменение приводит к регенерации всего изображения, хотя алгоритм старается максимально сохранить исходную структуру, где это возможно.
После создания изображения вы можете открыть интерфейс редактирования: доступен один инструмент выделения и кнопки отмены и повтора. Выделенная область используется для обозначения части, которую необходимо изменить. Это может быть удаление ненужного элемента, корректировка деталей или добавление нового элемента.
Для масштабных изменений можно указать инструкции прямо в запросе. Команда «удалить фон» обычно работает хорошо, тогда как более сложные изменения требуют более точной формулировки. Иногда система меняет ненужные элементы, поэтому полезно добавить уточнения типа: «Измените цвет зонта на красный. Других изменений не вносите».
«Расширять и совершенствовать»
Популярный кинематографический прием, когда компьютер «улучшает» размытое изображение нажатием одной-единственной кнопки, в реальности невозможен: информацию, которой там нет, восстановить невозможно. Однако ИИ может создать правдоподобную версию, которая выглядит более подробной.
Алгоритмы, удаляющие объекты и заполняющие фон, работают по принципам машинного обучения. В старых технологиях, таких как Content-Aware Fill в Photoshop, использовались более простые методы, а в современных моделях используются те же подходы, что и при создании новых изображений.
Аугментация также основана на заполнении недостающих деталей. Если первичная информация присутствует частично, система с меньшей вероятностью допустит ошибку. Результат никогда не будет таким же, как исходное изображение с высоким разрешением, но в большинстве случаев его достаточно для практического использования.
Применение стиля
ChatGPT хорошо известен своей способностью конвертировать фотографии в изображения в определенном стиле. Типичный пример — стилизация анимации Studio Ghibli. Качество зачастую высокое, но создатели, на стиль которых направлены запросы, обычно критически относятся к такой практике, а некоторые из них судятся с ИИ-компаниями.
Менее спорными являются запросы на стилизацию в виде акварели или переделки в стиле умерших много лет назад художников. Вы также можете скачать образец стиля и попросить применить его к другим изображениям.
В случае неудачного результата вы можете попросить систему описать стиль исходного изображения в новом чате, а полученное описание использовать для дальнейшей стилизации других фотографий.
Галерея
В разделе «Галерея» в верхней части боковой панели ChatGPT хранятся все изображения, созданные моделью GPT-4o. Галерея позволяет быстро вернуться к предыдущим работам, открыть исходный чат или посмотреть, как формировался исходный запрос.
Генерация видео с Сорой
Помимо генерации изображений, OpenAI создала систему Sora для генерации видео. Это отдельный сервис с отдельным интерфейсом. Сора способна создавать реалистичные видеоролики, но работа с ней требует отдельного подхода и гораздо большего объема рекомендаций, чем в рамках данного материала. При этом первые попытки могут основываться на тех же принципах, что и генерация изображений. Базовая версия позволяет создавать до 15 видеороликов по 10 секунд в день.
Авторские права на изображение AI
Изображения, созданные ИИ, не передают авторские права пользователю. Уровень детализации запроса или дальнейшие разъяснения не меняют этого факта. Другие пользователи могут копировать такие изображения и использовать их без ограничений. Запрещено утверждать, что такие изображения защищены авторским правом.
Однако если AI-изображение будет существенно модифицировано в графическом редакторе и в результате превратится в самостоятельное творческое произведение, то авторские права могут принадлежать уже новой версии. То же самое касается ситуации, когда художник перерисовывает сюжет, сгенерированный ИИ. Авторские права возникают на изображении, а не на сгенерированной выходной версии.
В Библиотеке Конгресса США есть подробное руководство по искусственному интеллекту и авторскому праву. В нем говорится, что существует риск нарушения прав других людей при использовании моделей, созданных на основе чужих работ. При личном использовании риски минимальны. Однако в коммерческой среде к этому следует относиться с особой осторожностью.



