Компанія Google впровадила нову функцію у розділі YouTube Shorts, яка дозволяє користувачам маніпулювати контентом інших авторів через модель штучного інтелекту Gemini Omni. Коли користувач натискає піктограму реміксу під коротким відео, з’являється опція reimagine, що відкриває доступ до інструментів перетворення візуального ряду. Це дає змогу автоматично змінювати стиль відеоролика, наприклад, перетворюючи реальні кадри на стилістику аніме, піксельну графіку або навіть імітацію фільмів жахів за допомогою текстових запитів до алгоритму.

Технічні можливості системи виходять далеко за межі зміни кольорової гами чи накладання фільтрів, оскільки алгоритм здатний змінювати об’єкти безпосередньо у кадрі. Зокрема, користувачі можуть непропорційно збільшувати голови людей, додавати нових персонажів у фоні, змінювати одяг героїв на костюми піратів або навіть інтегрувати у чуже відео власне зображення. Усі ці дії здійснюються шляхом обробки вихідного відеоданого нейронною мережею, яка генерує новий візуальний контент на основі наявного матеріалу.
З огляду на очевидні ризики щодо захисту приватності та інтелектуальної власності, Google надала авторам інструменти для обмеження використання їхніх відео. Творці контенту мають змогу самостійно вмикати або вимикати функцію переосмислення у налаштуваннях свого каналу, що запобігає маніпуляціям із приватними кадрами. Це важливо для користувачів, які не бажають, щоб їхні особисті відео чи матеріали за участю неповнолітніх були змінені сторонніми особами за допомогою алгоритмів штучного інтелекту без прямої згоди власника каналу.
Щоб уникнути повної дезінформації, розробники пообіцяли додавати до таких змінених роликів спеціальний цифровий водяний знак, який має маркувати походження контенту. Окрім візуальної мітки, кожне відео, створене через функцію реміксу, міститиме активне посилання на оригінальний матеріал, що дозволяє відстежити джерело вихідних даних. Ефективність цих маркерів наразі не перевірена незалежними експертами, тому залишається дискусійним питання, наскільки надійно ці інструменти захищатимуть права авторів від несанкціонованих маніпуляцій та поширення маніпулятивного візуального контенту.
Поточна версія інструменту є черговим етапом інтеграції генеративних моделей у повсякденні споживчі продукти, проте вона несе ризики щодо поширення підробок. Верифікація подібних функцій у масовому сегменті часто стикається з проблемами зловживання, що ставить питання про доцільність автоматизації таких інструментів для широкого загалу. Технологія Gemini Omni, що лежить в основі цих реміксів, потребує значних обчислювальних ресурсів, а відповідальність за отриманий у результаті такого редагування контент формально залишається на користувачеві, який ініціював процес зміни вихідного відеоролика.


