Фотографії як у «Гаррі Поттері»: штучний інтелект «оживляє» будь-яке зображення

29 Листопада 2023

Фанати «Гаррі Поттера» пам’ятають одну із примітних особливостей цього літературного всесвіту – рухомі фотографії. Нещодавно такі короткі анімації стало легко робити і в реальності. Новий штучний інтелект Stable Video Diffusion дозволяє перетворити будь-яке статичне фото на рухому анімацію.

Stability AI випустила Stable Video Diffusion як новий безкоштовний дослідницький інструмент штучного інтелекту, який може перетворити будь-яке нерухоме зображення на коротке відео. Це відкрита тестова версія двох моделей штучного інтелекту, які використовують техніку під назвою «зображення у відео». Її можна запускати локально на машині з відеокартою Nvidia.

Минулого року Stability AI викликав хвилю, випустивши Stable Diffusion – модель синтезу зображень, яка поклала початок хвилі згенерованих штучним інтелектом картинок. Тепер Stability хоче зробити те саме з відеосинтезом, хоча ця технологія все ще знаходиться в зародковому стані.

Наразі Stable Video Diffusion складається з двох моделей: одна, яка може створювати синтез зображення до відео довжиною 14 кадрів (називається SVD), і інша, яка генерує 25 кадрів (називається SVD-XT).

Вони можуть працювати на різних швидкостях від 3 до 30 кадрів на секунду та виводити короткі (зазвичай тривалістю 2-4 секунди) відеокліпи MP4 з роздільною здатністю 576?1024 точок.

Для роботи потрібно мати досить потужний комп’ютер. Наприклад, локальне створення 14-кадрової анімації зайняло близько 30 хвилин на відеокарті Nvidia RTX 3060, але можна експериментувати.

Враховуючи ці обмеження, Stability підкреслює, що модель ще рання і призначена лише для досліджень. Не дивно, що дослідницька стаття Stable Video Diffusion не розкриває джерело навчальних наборів даних моделей, лише стверджуючи, що дослідницька група використовувала «великий набір відеоданих, що включає приблизно 600 мільйонів зразків», які вони курували у великий набір відеоданих, який складається з 580 мільйонів анотованих відеокліпів, які охоплюють 212 років контенту.

Stable Video Diffusion — далеко не перша модель AI, яка пропонує таку функцію. Раніше подібні методи представили Meta , Google і Adobe. Джерело та ваги Stable Video Diffusion доступні на GitHub (https://github.com/Stability-AI/generative-models).

Теги
Технології

2561

Фотографії як у «Гаррі Поттері»: штучний інтелект «оживляє» будь-яке зображення

Подарунки за поповнення рахунку

USB-флешки стали загрозою для ПК

Анонсовано смартфон Archos Diamond Omega – безрамковий дизайн і дві подвійні камери

Усередині мобільної 3G-революції

Vodafone

Vodafone прокладе інтернет-кабель через Чорне море

Vodafone запускає сьомий набір у школу Big Data Lab

Vodafone Україна встановлює сонячні панелі на 100 базових станціях по всій Україні для безперебійного електроживлення

Нова реклама Vodafone пропонує поспати

Vodafone інвестував понад мільярд гривень у розбудову дротового інтернету

Статті

Огляд vivo X300 і X300 Pro – виглядає більш логічним продуктом

Інтернет визнати базовим правом людини – закликає філософ

Огляд M5 MacBook Pro: чудовий ноутбук, але що нового?

Огляд Samsung Galaxy A07 4G

Чи готові ми жити серед роботів? Переосмислення соціальних норм у добу інтелектуальної робототехніки

Енергоустановка на балконі – як німці зменшують свої платіжки за електрику

Чому ваш смартфон є прямим нащадком смерті космічних зірок

ПОРАДИ

Як створити зовнішній завантажувальний диск у macOS Tahoe

Як вимкнути режим DJ у Apple Music

Як скинути PRAM на Mac

СТАТТІ

Огляд vivo X300 і X300 Pro – виглядає більш логічним продуктом

Інтернет визнати базовим правом людини – закликає філософ

Огляд M5 MacBook Pro: чудовий ноутбук, але що нового?

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ

Фотографії як у «Гаррі Поттері»: штучний інтелект «оживляє» будь-яке зображення

Vodafone

Залишайтеся з нами

Статті

ПОРАДИ

СТАТТІ

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ