Суббота, 27 апреля, 2024

Несколько слов сделают видео – Facebook (Meta) запустила генератор видео по словесному описанию

Теперь можно создавать не только картинки, описав их словами. Facebook (ныне Meta) таким образом уже создает видео. Новая система называется Make-A-Video и генерирует ролики продолжительностью до пяти секунд.

Видео явно искусственные, с размытыми объектами и искаженной анимацией, но все же представляют значительное развитие в сфере создания контента ИИ.

В сообщении на Facebook генеральный директор Meta Марк Цукерберг описал эту работу как «удивительный прогресс», добавив: «Сгенерировать видео гораздо труднее, чем фотографии, потому что помимо правильной генерации каждого пикселя система также должна предугадать, как они будут меняться со временем. »

Ролики длятся не более пяти секунд и не содержат звука, но обхватывают большой диапазон подсказок. Лучший способ оценить производительность модели – наблюдать ее результат.

Хотя понятно, что эти видео сгенерированы компьютером, результаты таких моделей ИИ быстро улучшатся в ближайшее время. Для сравнения: всего за несколько лет генераторы изображений с искусственным интеллектом перешли от создания предельно непонятных изображений к фотореалистическому содержимому.

Как и в случае с моделями преобразования текста в изображение, есть тревожные перспективы. Исходные данные этих инструментов могут использоваться для дезинформации, пропаганды и, скорее всего, на основе того, что мы видели с системами изображений ИИ и дипфейками.

Meta говорит, что хочет «продумать то, как мы создаем новые генеративные системы искусственного интеллекта, как эта», и сейчас публикует только статью о модели Make-A-Video.Компания говорит, что планирует выпустить демонстрационную версию системы, но не сообщает, когда и как доступ к модели может быть ограничен.

Meta не единственное учреждение, работающее над видеогенераторами ИИ. К примеру, в начале этого года группа исследователей из Университета Цинхуа и Пекинской академии искусственного интеллекта (BAAI) выпустила собственную модель преобразования текста в видео под названием CogVideo (единственная другая общедоступная модель преобразования текста в видео).

Євген
Євген
Евгений пишет для TechToday с 2012 года. По образованию инженер,. Увлекается реставрацией старых автомобилей.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися