П’ятниця, 22 Листопада, 2024

Кілька слів зроблять відео – Facebook (Meta) запустив генератор відео за словесним описом

Тепер можна створювати не тільки картинки, описавши їх словами. Facebook (нині Meta) таким чином уже створює відео. Нова система називається Make-A-Video і генерує ролики тривалістю до п’яти секунд.

Відео є явно штучними, з розмитими об’єктами та спотвореною анімацією, але все ж представляють значний розвиток у сфері створення контенту ШІ.

У дописі на Facebook генеральний директор Meta Марк Цукерберг описав цю роботу як «дивовижний прогрес», додавши: «Згенерувати відео набагато важче, ніж фотографії, тому що крім правильної генерації кожного пікселя, система також повинна передбачити, як вони будуть змінюватися з часом. »

Ролики тривають не більше п’яти секунд і не містять звуку, але охоплюють величезний діапазон підказок. Найкращий спосіб оцінити продуктивність моделі – спостерігати за її результатом.

Хоча зрозуміло, що ці відео згенеровані комп’ютером, результати таких моделей ШІ швидко покращаться найближчим часом. Для порівняння: лише за кілька років генератори зображень зі штучним інтелектом перейшли від створення гранично незрозумілих зображень до фотореалістичного вмісту.

Як і у випадку з моделями перетворення тексту в зображення, є тривожні перспективи. Вихідні дані цих інструментів можуть бути використані для дезінформації, пропаганди та, швидше за все, на основі того, що ми бачили з системами зображень ШІ та дипфейками.

Meta каже, що хоче «продумати те, як ми створюємо нові генеративні системи штучного інтелекту, як ця», і зараз лише публікує статтю про модель Make-A-Video. Компанія каже, що планує випустити демонстраційну версію системи, але не повідомляє, коли і як доступ до моделі може бути обмежений.

Meta не єдина установа, яка працює над відеогенераторами ШІ. Наприклад, на початку цього року група дослідників з Університету Цінхуа та Пекінської академії штучного інтелекту (BAAI) випустила власну модель перетворення тексту у відео під назвою CogVideo (єдина інша загальнодоступна модель перетворення тексту у відео).

Євген
Євген
Євген пише для TechToday з 2012 року. Інженер за освітою. Захоплюється реставрацією старих автомобілів.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися