Google представив VLOGGER – штучний інтелект, який може оживляти по фотографії

19 Березня 2024

Дослідники Google розробили новий штучний інтелект (ШІ, AI), який може створювати реалістичні відео людей, які розмовляють, жестикулюють і рухаються — лише з однієї нерухомої фотографії. Технологія, яка називається VLOGGER, генерує вражаюче реалістичний відеоматеріал, відкриваючи низку потенційних застосувань, а також викликаючи занепокоєння щодо дипфейків і дезінформації.

Описана в дослідницькій статті під назвою «VLOGGER: Мультимодальна дифузія для синтезу втіленого аватару», модель AI може приймати фото людини та аудіозапис як вхідні дані, а потім виводити відео, показуючи людину, яка говорить слова і робить відповідну міміку, рухи головою та жести руками. Відео не ідеальні, з деякими артефактами, але являють собою значний стрибок у можливості анімації нерухомих зображень.

Дослідники на чолі з Енріком Короною з Google Research використали тип моделі машинного навчання під назвою дифузійні моделі, щоб досягти нового результату. Дифузійні моделі нещодавно показали чудову продуктивність у створенні дуже реалістичних зображень із текстових описів. Розширивши їх у сферу відео та навчивши їх на величезному новому наборі даних, команда змогла створити систему штучного інтелекту, яка може оживляти фотографії дуже переконливим способом.

Ключовим фактором стала підготовка величезного нового набору даних під назвою MENTOR, який містить понад 800 000 різноманітних ідентифікаторів і 2200 годин відео — на порядок більше, ніж було доступно раніше. Це дозволило VLOGGER навчитися створювати відео людей різної етнічної приналежності, віку, одягу, поз і оточення без упередженості.

Технологія відкриває ряд переконливих варіантів використання. VLOGGER може автоматично дублювати відео іншими мовами, просто замінюючи звукову доріжку, плавно редагувати та заповнювати відсутні кадри у відео, а також створювати повне відео людини з однієї фотографії. Цю технологію також можна використовувати для створення фотореалістичних аватарів для віртуальної реальності та ігор. І це може дозволити створювати віртуальних помічників і чат-ботів на основі штучного інтелекту, які будуть більш привабливими та виразними.

Google розглядає VLOGGER як крок до «втілених розмовних агентів», які можуть спілкуватися з людьми природним шляхом за допомогою мови, жестів і зорового контакту.

Однак ця технологія також має потенціал для зловживання, наприклад, для створення дипфейків — синтетичних медіафайлів, у яких людину у відеозаписі замінюють на когось іншого. Оскільки створені штучним інтелектом відео стають більш реалістичними та легшими для створення, це може загострити проблеми, пов’язані з дезінформацією та цифровими підробками.

Вражаючий, VLOGGER все ж має обмеження. Згенеровані відео відносно короткі та мають статичний фон. Люди не пересуваються в 3D-середовищі. Їхні манери та мовлення, хоч і реалістичні, все ж таки відрізняються від манери справжніх людей.

VLOGGER дає раннє уявлення про це майбутнє. Це потужна демонстрація швидкого прогресу штучного інтелекту та ознака зростаючих труднощів, з якими ми зіткнемося, розрізняючи, що є справжнім, а що підробкою.

Теги
Технології

1796

Google представив VLOGGER – штучний інтелект, який може оживляти по фотографії

Швейцарская почта заменила марки на SMS

Люди потрапили в глобальний експеримент: ми закохуємося та стаємо залежними від штучного інтелекту

В Японії запропонували заборонити завантажувати файли з інтернету

Когда и по какой цене в Украину приедут мобильные новинки

Vodafone

Vodafone Україна разом з абонентами допомогли вилікувати 289 дітей

Vodafone Україна тестуватиме перехід на 4G в Ковелі

Віталій Козловський став обличчям нової рекламної кампанії Vodafone

Vodafone інвестував понад 5,3 мільярди гривень в економіку України протягом 3х кварталів 2025

Vodafone прокладе інтернет-кабель через Чорне море

Статті

ChatGPT руйнує шлюби: люди використовують ШІ, щоб атакувати одне одного

Квантовий комп’ютер? Краще взяти комп’ютер 1981 року, абакус і собаку

Чи є рідинне охолодження у смартфонах ефективним? iPhone оснастили рідинним охолодженням, щоб перевірити результат

Як ШІ-моделі генерують відео: зрозуміле пояснення

Огляд OnePlus 15: купуйте, якщо вам набридло заряджати смартфон

Люди потрапляють до психлікарні після спілкування з ШІ

Заряджання 30-80% не зберігає батарейку – результати 2-річного тесту 40 телефонів

ПОРАДИ

Як контролювати артеріальний тиск за допомогою Apple Watch Ultra 2

Як очистити кеш на iPhone

Як швидко відновити Windows 11 після збою завантаження

СТАТТІ

ChatGPT руйнує шлюби: люди використовують ШІ, щоб атакувати одне одного

Квантовий комп’ютер? Краще взяти комп’ютер 1981 року, абакус і собаку

Чи є рідинне охолодження у смартфонах ефективним? iPhone оснастили рідинним охолодженням, щоб перевірити результат

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ

Google представив VLOGGER – штучний інтелект, який може оживляти по фотографії

Vodafone

Залишайтеся з нами

Статті

ПОРАДИ

СТАТТІ

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ