Google представил VLOGGER – искусственный интеллект, который может оживлять по фотографии

19 марта 2024

Исследователи Google разработали новый искусственный интеллект (ИИ, AI), который может создавать реалистичные видео людей, говорящих, жестикулирующих и двигающихся — только по одной неподвижной фотографии. Технология, которая называется VLOGGER, генерирует поразительно реалистичный видеоматериал, открывая ряд потенциальных применений, а также вызывая беспокойство по поводу дипфейков и дезинформации.

Описанная в исследовательской статье под названием «VLOGGER: Мультимодальная диффузия для синтеза воплощенного аватара», модель AI может принимать фото человека и аудиозапись как входные данные, а затем выводить видео, показывая человека, который говорит слова и делает соответствующую мимику, движения головой и жесты руками . Видео не идеальны, с некоторыми артефактами, но представляют собой значительный скачок в возможности анимации неподвижных изображений.

Исследователи во главе с Энриком Короной из Google Research использовали тип модели машинного обучения под названием диффузионные модели для достижения нового результата. Диффузионные модели недавно показали отличную производительность в создании очень реалистичных изображений из текстовых описаний. Расширив их в область видео и обучив их на огромном новом наборе данных, команда смогла создать систему искусственного интеллекта, которая может оживлять фотографии очень убедительным способом.

Ключевым фактором стала подготовка огромного нового набора данных под названием MENTOR, содержащая более 800 000 разнообразных идентификаторов и 2200 часов видео — на порядок больше, чем было доступно ранее. Это позволило VLOGGER научиться создавать видео людей разной этнической принадлежности, возраста, одежды, поз и свиты без предвзятости.

Технология открывает ряд убедительных вариантов использования. VLOGGER может автоматически дублировать видео на других языках, просто заменяя звуковую дорожку, плавно редактировать и заполнять отсутствующие кадры в видео, а также создавать полное видео человека с одной фотографии. Эту технологию можно использовать для создания фотореалистичных аватаров для виртуальной реальности и игр. И это может позволить создавать виртуальные помощники и чат-боты на основе искусственного интеллекта, которые будут более привлекательными и выразительными.

Google рассматривает VLOGGER как шаг к «воплощенным разговорным агентам», которые могут общаться с людьми естественным путем посредством языка, жестов и зрительного контакта.

Однако у этой технологии также есть потенциал для злоупотребления, например, для создания дипфейков — синтетических медиафайлов, в которых человека в видеозаписи заменяют на кого-то другого. Поскольку созданные искусственным интеллектом видео становятся более реалистичными и более легкими для создания, это может обострить проблемы, связанные с дезинформацией и цифровыми подделками.

Впечатляющий, VLOGGER все же имеет ограничение. Сгенерированные видеоролики относительно короткие и имеют статический фон. Люди не передвигаются в 3D-среде. Их манеры и речи, хоть и реалистичные, все же отличаются от манеры настоящих людей.

VLOGGER дает раннее представление об этом будущем. Это мощная демонстрация быстрого прогресса искусственного интеллекта и признак возрастающих трудностей, с которыми мы столкнемся, различая, что подлинно, а что подделка.

Теги
Технологии

647

Google представил VLOGGER – искусственный интеллект, который может оживлять по фотографии

Если вам нужен VPN, не обновляйте Windows, пока Microsoft ищет решение

Как в Safari на iPhone автоматически закрывать вкладки

Как в Chrome включить блокировщик «тяжелой» рекламы

Робомобили за десятилетие изменят авторынок масштабнее, чем за последние сто лет

Vodafone

Vodafone добавил солнечную генерацию на первые 100 базовых станций

Vodafone в 1 кв. 2026: стабильность бизнеса и инвестиции в телеком-инфраструктуру Украины

Vodafone запускает 5G в межнациональном роуминге

200 грн в месяц: Vodafone запустил акцию для клиентов 55+

Vodafone инвестировал в критическую инфраструктуру и технологии более 24 млрд. грн

Статті

Производители скрывают истинную скорость USB-C на ноутбуке

Какие недостатки у шестнадцатидюймовых ноутбуков

45 «землеподобных» планет обнаружено – означает ли это, что мы больше не одиноки во Вселенной

NASA опровергло пять популярных мифов о космосе на основе научных наблюдений и данных

Астронавт год летал, 811 его генов изменили прописку, а мозг замедлился

Тестирование зарядных устройств. Не перегреваются, но некоторые мощные все равно «плывут»

Как испанский компьютерный вирус принес в мир антивирусный сервис Virus Total, приобретенный Google

ПОРАДИ

Способы использования устаревших смарт-часов Samsung Galaxy Watch вместо утилизации

Как устранить распространенные программные и аппаратные неисправности в смартфонах серии Samsung Galaxy

Как защитить домашнюю сеть изменением настроек роутер

СТАТТІ

Производители скрывают истинную скорость USB-C на ноутбуке

Какие недостатки у шестнадцатидюймовых ноутбуков

45 «землеподобных» планет обнаружено – означает ли это, что мы больше не одиноки во Вселенной

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ

Google представил VLOGGER – искусственный интеллект, который может оживлять по фотографии

Vodafone

Залишайтеся з нами

Статті

ПОРАДИ

СТАТТІ

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ