Компания Google внедрила новую функцию в разделе YouTube Shorts, которая позволяет пользователям манипулировать контентом других авторов через модель искусственного интеллекта Gemini Omni. Когда пользователь нажимает значок ремикса под коротким видео, появляется опция reimagine (переосмысление), открывающая доступ к инструментам преобразования визуального ряда. Это дает возможность автоматически менять стиль видеоролика, например, превращая реальные кадры в стилистику аниме, пиксельную графику или даже имитацию фильмов ужасов с помощью текстовых запросов к алгоритму.

Технические возможности системы выходят далеко за пределы изменения цветовой гаммы или наложения фильтров, поскольку алгоритм способен изменять объекты непосредственно в кадре. В частности, пользователи могут непропорционально увеличивать головы людей, добавлять новых персонажей на фоне, менять одежду героев на костюмы пиратов или даже интегрировать в чужое видео собственное изображение. Все эти действия осуществляются путем обработки исходных видеоданных нейронной сетью, которая генерирует новый визуальный контент на основе имеющегося материала.
Учитывая очевидные риски в отношении защиты приватности и интеллектуальной собственности, Google предоставила авторам инструменты для ограничения использования их видео. Создатели контента имеют возможность самостоятельно включать или выключать функцию переосмысления в настройках своего канала, что предотвращает манипуляции с личными кадрами. Это важно для пользователей, которые не желают, чтобы их личные видео или материалы с участием несовершеннолетних были изменены посторонними лицами с помощью алгоритмов искусственного интеллекта без прямого согласия владельца канала.
Чтобы избежать полной дезинформации, разработчики пообещали добавлять к таким измененным роликам специальный цифровой водяной знак, который должен маркировать происхождение контента. Помимо визуальной метки, каждое видео, созданное через функцию ремикса, будет содержать активную ссылку на оригинальный материал, что позволяет отследить источник исходных данных. Эффективность этих маркеров на данный момент не проверена независимыми экспертами, поэтому остается дискуссионным вопрос, насколько надежно эти инструменты будут защищать права авторов от несанкционированных манипуляций и распространения манипулятивного визуального контента.
Текущая версия инструмента является очередным этапом интеграции генеративных моделей в повседневные потребительские продукты, однако она несет риски относительно распространения подделок. Верификация подобных функций в массовом сегменте часто сталкивается с проблемами злоупотребления, что ставит вопрос о целесообразности автоматизации таких инструментов для широкой аудитории. Технология Gemini Omni, лежащая в основе этих ремиксов, требует значительных вычислительных ресурсов, а ответственность за полученный в результате такого редактирования контент формально остается на пользователе, который инициировал процесс изменения исходного видеоролика.


