Фотографии как в «Гарри Поттере»: искусственный интеллект «оживляет» любое изображение

29 ноября 2023

Фанаты «Гарри Поттера» помнят одну из примечательных особенностей этой литературной вселенной – подвижные фотографии. Недавно столь короткие анимации стало легко делать и в реальности. Новый искусственный интеллект Stable Video Diffusion позволяет превратить любое статическое фото в подвижную анимацию.

Stability AI выпустила Stable Video Diffusion как новый бесплатный исследовательский инструмент искусственного интеллекта, который может превратить любое неподвижное изображение в короткое видео. Это открытая тестовая версия двух моделей искусственного интеллекта, использующих технику под названием «изображение в видео». Ее можно запускать локально на машине с видеокартой Nvidia.

В прошлом году Stability AI вызвал волну, выпустив Stable Diffusion – модель синтеза изображений, которая положила начало волне сгенерированных искусственным интеллектом картинок. Теперь Stability хочет сделать то же с видеосинтезом, хотя эта технология все еще находится в зачаточном состоянии.

Stable Video Diffusion состоит из двух моделей: одна, которая может создавать синтез изображения к видео длиной 14 кадров (называется SVD), и другая, которая генерирует 25 кадров (называется SVD-XT).

Они могут работать на разных скоростях от 3 до 30 кадров в секунду и выводить короткие (обычно продолжительностью 2-4 секунды) видеоклипы MP4 с разрешением 576х1024 точек.

Для работы нужно иметь достаточно мощный компьютер. К примеру, локальное создание 14-кадровой анимации заняло около 30 минут на видеокарте Nvidia RTX 3060, но можно экспериментировать.

Учитывая эти ограничения, Stability подчеркивает, что модель еще ранняя и предназначена только для исследований. Неудивительно, что исследовательская статья Stable Video Diffusion не раскрывает источник обучающих наборов данных моделей, лишь утверждая, что исследовательская группа использовала «большой набор видеоданных, включающий примерно 600 миллионов образцов», которые они курировали в большой набор видеоданных, состоящий из 580 миллионов аннотированных видеоклипов, охватывающих 212 лет контента.

Stable Video Diffusion – далеко не первая модель AI, предлагающая такую ??функцию. Ранее подобные методы представили Meta, Google и Adobe. Источник и вес Stable Video Diffusion доступны на GitHub (https://github.com/Stability-AI/generative-models).

Теги
Технологии

801

Фотографии как в «Гарри Поттере»: искусственный интеллект «оживляет» любое изображение

Vivo создала для Android функцию «атомной мастерской», чтобы ускорить многозадачность на смартфоне

Полноэкранный YouTube станет удобнее на смартфоне

CES 2018: LG показала смарт-динамик ThinQ WK9

Google теперь ищет лучшее с точными указаниями в кавычках

Vodafone

Vodafone инвестировал в ветеранские бизнесы еще 1 млн грн

Абоненты Vodafone смогут получать скоростной интернет при отсутствии мобильной сети-через спутник

Старт 7-го сезона Big Data Lab: Vodafone готовит Data Scientists для украинского рынка

Результаты «Роуминг как дома» — более 900 тысяч пользователей в месяц

Vodafone запустил тестирование 5G в Харькове в День влюбленных

Статті

Срок действия сертификатов Secure Boot истекает: что это означает для вашего ПК

Электроэнергетика в настоящее время сдерживает рост мировой экономики

HDMI 2.2: Фантазии 12K и 480 Гц остаются лишь мечтами

Обзор Moto G & G Play (2026): полное “фу”. Однако у него есть разъем 3,5 мм аудио и слот microSD

Феномен Moltbook: ИИ агенты формируют коллективное сознание или играют роли?

Эту стриптизершу можно назвать автором современного интернета с подписками. Как это получилось?

Огляд Xiaomi Redmi Note 15 5G

ПОРАДИ

Windows 11 может работать быстрее. Пять действенных настроек ускорения Windows

Как последовательно подключить несколько мониторов с помощью одного кабеля

Как уменьшить нагрев и энергопотребление видеокарты при сохранении ее производительности

СТАТТІ

Срок действия сертификатов Secure Boot истекает: что это означает для вашего ПК

Электроэнергетика в настоящее время сдерживает рост мировой экономики

HDMI 2.2: Фантазии 12K и 480 Гц остаются лишь мечтами

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ

Фотографии как в «Гарри Поттере»: искусственный интеллект «оживляет» любое изображение

Vodafone

Залишайтеся з нами

Статті

ПОРАДИ

СТАТТІ

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ