Понеділок, 29 Грудня, 2025

Як генерувати картнинки у ШІ: поради щодо зображень у ChatGPT

Здатність сучасних AI сервісів генерувати зображення є добре відомою і залишається одним з найпоширеніших напрямів використання таких платформ, як ChatGPT. Водночас ця сфера супроводжується значною кількістю суперечок. Фотографи, художники та кінематографісти висловлюють невдоволення тим, що OpenAI та інші компанії здійснювали навчання своїх моделей на їхніх роботах, захищених авторським правом.

У цьому матеріалі зібрано практичні поради щодо того, як працювати із системою та отримувати кращі результати.

Створення зображень за текстовими запитами

Найочевидніша функція полягає в можливості створити повністю нове зображення на основі текстового опису. Достатньо ввести запит на кшталт «створити картинку із двома кролями, що грають на лузі» або «згенерувати фотореалістичне зображення жінки, яка сидить перед комп’ютером і п’є каву з чашки з написом PC for Everyone», і система створить варіант, який можна завантажити та використовувати.

Частина згенерованих зображень буває досить якісною. Інші можуть не відповідати опису або містити помітні помилки. Сучасні моделі рідше формують сюжети із надлишковими кінцівками чи хибною анатомією, однак значущі похибки все одно трапляються.

У разі невідповідного результату можна або продовжувати роботу в тому самому чаті, уточнюючи запит, або сформувати новий чи змінений запит. Ефективність залежить від ситуації. На практиці невеликі правки не завжди дають суттєве покращення, а так зване промпт-інжинірингування не має стабільної формули успіху. Навіть мінімальне логічне уточнення типу «один кріль має рожевий нашийник» або «вона тримає чашку у лівій руці» може повністю змінити композицію або, навпаки, дати очікувану точність.

П’ять порад для створення кращих зображень за допомогою ChatGPT

  1. Чітко описувати бажане
    Якщо існує чітке уявлення про потрібне зображення, варто викласти його максимально зрозуміло. Формулювання на кшталт «дівчина з темним волоссям і світлою шкірою сидить за піаніно в старовинному будинку зі старовинними меблями» точніше передає задум, ніж загальна фраза на зразок «дівчина грає на піаніно». За відсутності чіткої візії система також не зможе дати точний результат.

  2. Не перевантажувати опис
    Деталізація є важливою, однак надмірний обсяг призводить до втрати цілісності запиту. Дуже великий обсяг тексту з наддетальним описом підвищує ймовірність отримання непридатного результату. Варто описати головне, дозволивши системі заповнити другорядні деталі.

  3. Заздалегідь вказувати технічні параметри
    Корисно уточнювати формат і стиль: вертикальне чи квадратне зображення, фотографія чи живопис, насичені чи приглушені кольори, тепле чи холодне освітлення, домінування об’єкта на передньому плані тощо. Важливо описувати не лише зміст, але і спосіб виконання.

  4. Повторювати спроби
    Якщо результат не відповідає очікуванням, можна попросити систему створити кілька варіантів або змінити запит. Можна спробувати збільшити рівень деталізації або, навпаки, спростити опис.

  5. Використовувати ескіз
    Якщо є можливість намалювати простий ескіз композиції, можна попросити систему перетворити його на завершене зображення у бажаному стилі. Якість сильно залежить від сюжету та складності, і трапляються похибки, зокрема хибні напрямки погляду чи нелогічні пози.

Редагування та поліпшення власних зображень

Окрім створення нових зображень, ChatGPT дозволяє редагувати наявні. Важливо, що технічно це не класичне редагування. Кожна зміна спричиняє повторне генерування всього зображення, хоча алгоритм намагається максимально зберегти початкову структуру там, де це можливо.

Після створення зображення можна відкрити інтерфейс редагування: доступний один інструмент виділення та кнопки скасування і повтору. Виділена область слугує для вказання частини, яку потрібно змінити. Це може бути видалення непотрібного предмета, коригування деталей або додавання нового елементу.

Для масштабних змін можна вказувати інструкції напряму у запиті. Команда «видалити фон» зазвичай працює добре, тоді як комплексніші зміни потребують більш точного формулювання. Іноді система змінює зайві елементи, тому корисно додавати уточнення на кшталт: «Змінити колір парасольки на червоний. Не вносити інших змін».

«Збільшити та покращити»

Популярний кінематографічний прийом, коли комп’ютер «удосконалює» нечітке зображення шляхом натискання однієї кнопки, у реальності неможливий: інформація, якої немає, не може бути відновлена. Однак AI може згенерувати правдоподібну версію, яка виглядає більш деталізованою.

Алгоритми, що видаляють об’єкти та заповнюють фон, працюють за принципами машинного навчання. Старіші технології на кшталт Content-Aware Fill у Photoshop використовували простіші методи, тоді як сучасні моделі використовують ті самі підходи, що і при генерації нових зображень.

Збільшення також базується на заповненні бракуючих деталей. Якщо первинна інформація частково присутня, система рідше помиляється. Результат ніколи не дорівнюватиме зображенню, зробленому спершу у високій роздільності, однак у більшості випадків цього достатньо для практичного використання.

Застосування стилю

ChatGPT добре відомий здатністю перетворювати фото на зображення в певному стилі. Поширеним прикладом є стилізація під анімацію студії Ghibli. Якість часто висока, але творці, на стиль яких орієнтовані запити, зазвичай критично ставляться до таких практик, і частина з них судиться з AI-компаніями.

Менш суперечливими є запити на стилізацію у вигляді акварелі або перетворення у стилі художників, що померли багато років тому. Також можна завантажити зразок стилю і попросити застосувати його до інших зображень.

У разі невдалого результату можна попросити систему описати стиль вихідного зображення у новому чаті, а отриманий опис використати для подальшої стилізації інших фото.

Галерея

У розділі Gallery у верхній частині бокової панелі ChatGPT зберігаються всі зображення, створені моделлю GPT-4o. Галерея дає змогу швидко повернутися до попередніх робіт, відкрити вихідний чат або переглянути, як був сформований початковий запит.

Генерація відео за допомогою Sora

Окрім генерації зображень, OpenAI створила систему Sora для формування відео. Це окремий сервіс з окремим інтерфейсом. Sora здатна формувати реалістичні відео, однак робота з нею вимагає окремого підходу та значно більшого обсягу рекомендацій, ніж у межах цього матеріалу. Водночас перші спроби можуть базуватися на тих самих принципах, що і генерація зображень. Базова версія дозволяє створювати до 15 роликів тривалістю 10 секунд на добу.

Авторське право на AI-зображення

Зображення, створені за допомогою AI, не дають авторських прав користувачу. Рівень деталізації запиту або подальші уточнення не змінюють цього факту. Інші користувачі можуть копіювати такі зображення і використовувати їх без обмежень. Заборонено заявляти, що на такі зображення належать авторські права.

Однак якщо AI-зображення суттєво доопрацьоване в графічному редакторі і внаслідок цього перетворилося на самостійну творчу роботу, тоді авторські права можуть належати вже на нову версію. Те саме стосується ситуації, коли художник перемальовує AI-згенерований сюжет. Авторське право виникає на картину, а не на згенерований вихідний варіант.

Бібліотека Конгресу США має докладний посібник щодо AI і авторського права. У ньому зазначено, що існують ризики порушення прав інших осіб при використанні моделей, які навчалися на чужих роботах. Для особистого використання ризики мінімальні. Однак у комерційному середовищі необхідно ставитися до цього з максимальною уважністю.

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Євген
Євген
Євген пише для TechToday з 2012 року. Інженер за освітою. Захоплюється реставрацією старих автомобілів.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися

Статті