В последние дни интернетом ширятся короткометражные видео, которые выглядят, как будто их создала профессиональная студия. На самом деле эти фильмы созданы с помощью искусственного интеллекта. Журналисты издания WSJ сами создали такое реалистичное видео, чтобы увидеть, насколько сложным является процесс. Короткий ответ-за секунду такое видео не создать.
Журналисты пытались снять фильм об искусственном интеллекте с помощью искусственных интеллектов Veo и Runway. Эти инструменты-колдовство. Процесс работы с ними-безумие.
Каждый кадр фильма «Мой робот и я» был сгенерирован с помощью искусственного интеллекта. Большая часть аудиозаписи тоже создал ИИ, кроме голоса журналистки.
Но создание этой короткометражки оказалось очень трудным. После тысячи черновых роликов, дней работы и кто знает, сколько вычислительных мощностей, вышел трехминутный фильм — о жизни журналистки с новым видом эффективного робота.
Всего несколько лет назад созданный искусственным интеллектом клип, в котором Уилл Смит ест спагетти, стал вирусным, потому что это ужасно выглядело. Теперь эти инструменты могут отображать сцены, которые выглядят почти безупречно — по крайней мере, на первый взгляд.
Протестировав множество опций, журналисты остановились на veo от Google и инструменте от стартапа Runway AI. Они предоставили наилучшее сочетание качества и контроля. Sora от OpenAI была далеко не так хороша. 20 мая Google выпустила Veo 3, который добавляет аудио на базе искусственного интеллекта, включая диалоги и звуковые эффекты. Посмотрите, насколько реалистичным стал Уилл Смит со спагетти сейчас.
Но журналисты предупреждают, что не стоит думать, что вы можете вставить сценарий, и появится хит Netflix. Каждый их кадр был результатом множества подсказок и попыток генерации. А чтобы персонажи и декорации оставались неизменными от сцены к сцене, пришлось изобрести целый производственный конвейер.
Журналисты использовали генератор изображений AI Midjourney для создания декораций (Пригородный район, редакция новостей) и для создания персонажа робота. Затем они использовали реальные фотографии журналистки меня для создания ее виртуальной копии.
Материалы загрузили их на Runway или Veo, где написали подсказки. Вот один из них:
«Снимок под низким углом: Джоанна отжимается в быстром темпе, сохраняя прямую линию от головы до пят. Робот стоит сверху, наблюдая и направляя».
Эта тщательная, конкретная формулировка имела огромное значение. Режиссер мог разбивать сцены такт за тактом, определяя ракурсы съемки, стили освещения и движения.
И на это все еще ушло более 1000 черновых видеороликов. Некоторые были полными катастрофами, с анатомическими кошмарами и случайными новыми персонажами. Даже в» хороших » сценах лицо журналистки выглядит по-разному почти в каждом кадре.
Однако короткометражка была создана без огромного бюджета, реквизиторских отделов и команд по спецэффектам. Общая стоимость оплаты видеоинструментов Google и Runway с искусственным интеллектом составила несколько тысяч долларов.