Понедельник, 17 ноября, 2025

Что такое Sora: все, что стоит знать об этом видеогенераторе от OpenAI

В последнее время социальные сети заполонили короткие видео, выглядящие одновременно правдоподобно и удивительно искусственными. За это можно поблагодарить Sora – видеомодель от OpenAI, которая стремительно набирает популярность.

Sora-это генеративная система создания видео, разработанная OpenAI, которая преобразует текстовые описания, изображения или видеофрагменты в готовые короткие ролики. Например, если ввести описание «пластиковый пакет летит в воздухе, подхваченный ветром», Sora создаст соответствующее видео с естественным движением и реалистичным освещением.

Модель была впервые представлена в начале 2024 года и стала доступна пользователям ChatGPT Plus и Pro в декабре того же года. Он основан на предыдущих системах преобразования текста в изображение, таких как DALL·E, но использует обновленную архитектуру, позволяющую создавать более естественную динамику и более стабильное изображение.

Важно не путать десктопную версию Sora, используемую для генерации видео, с мобильным приложением Sora для iOS и Android или с одноименным приложением для чтения. Социальное приложение работает на основе модели Sora 2, тогда как настольная версия может использовать как оригинальную модель, так и обновленную Sora 2 – в зависимости от региона.

Как работает Sora

Sora-это диффузионная модель. Она начинает создание видео из кадра, заполненного статическим шумом, и постепенно убирает его, пока из него не формируется сцена, соответствующая текстовому описанию. Модель Sora 2, выпущенная 30 сентября, уже поддерживает синхронизированные диалоги и звуковые эффекты, в то время как предыдущие версии создавали только беззвучные видео.

Sora разбивает изображения и кадры на небольшие фрагменты данных, называемые патчами. Это позволяет лучше понимать движение, текстуры и детали в различных форматах и длительности. По своей функции патчи напоминают токены в речевых моделях, которые делят текст на более мелкие единицы (слова, знаки препинания), что позволяет системе создавать согласованный результат.

Пользователь может загрузить текстовое описание, статические изображения или короткие видео в качестве вывода, а также задать продолжительность от 5 до 20 секунд и разрешение от 480p до 1080p.

Sora моделирует не только внешний вид объектов, но и то, как они ведут себя в реальном мире. Ранее такие модели часто ошибались с физическими взаимодействиями-например, человек в видео мог кусать печенье, но отметины укуса не появлялись. В Sora 2 эти детали моделируются значительно точнее, хотя OpenAI признает, что система «все еще допускает определенные ошибки», даже несмотря на то, что теперь лучше придерживается законов физики.

Возможности использования

Sora позиционируется не только как развлекательный инструмент, но и как средство для профессионального видеопроизводства. Одной из новых функций стала раскадровка (storyboarding) – возможность создавать последовательность сцен перед генерацией видео, подобно тому, как это делают кинематографисты. Функция доступна пользователям Plus и Pro в настольной версии.

Большинство видео, созданных в Sora, пока короткие и экспериментальные. Однако расширение функционала – увеличение продолжительности, улучшение качества и введение инструментов планирования-свидетельствует о стремлении OpenAI сделать Sora пригодной для более профессиональных и творческих задач.

Некоторые художники, такие как Арвида Быстрем, уже используют возможности модели в художественных целях. Он интерпретирует системные ошибки, например, когда ИИ искажает тело или добавляет лишнюю конечность, как часть творческого процесса, а не как недостаток. Такой подход открывает новые горизонты в цифровом искусстве, где” неправильность » становится источником вдохновения.

Однако для большинства пользователей Sora остается инструментом быстрого создания контента для социальных сетей, часто без особой ценности-так называемого AI slop.

Вопросы доверия и восприятия

Ученые и эксперты по этике предупреждают, что распространение подобных инструментов может серьезно повлиять на восприятие реальности. С одной стороны, генеративное видео демократизирует производство контента, с другой – размывает грань между правдой и вымыслом.

Как отмечает Натаниэль Фаст, директор Центра этического лидерства Университета Южной Калифорнии, в лучшем случае люди просто проигнорируют такой контент, в худшем – «потеряют способность различать, что реально».

Доступность и стоимость

OpenAI разделила доступ к Sora на две части: веб-интерфейс для профессионального использования и мобильное приложение для социального видео.

Настольная версия поддерживает более длинные видео, раскадровку и более высокое качество. Мобильные приложения для iOS и Android ориентированы на короткий контент и функционируют по принципу TikTok. С октября 2024 года пользователи в США, Канаде, Японии и Южной Корее могут регистрироваться без приглашения.

Базовые функции Sora доступны в бесплатной учетной записи ChatGPT с ограничением примерно 30 генераций видео в день. Подписка ChatGPT Plus за 20 долларов в месяц увеличивает дневной лимит, а тариф Pro за 200 долларов открывает расширенные возможности — видео высокого разрешения, большую продолжительность и возможность загрузки без водяного знака. Также предусмотрена оплата за дополнительные пакеты генераций-около 4 долларов за 10 видео.

Контроверсии и вызовы

Переход OpenAI от создания изображений к видео стал очередным этапом трансформации креативных индустрий. Если раньше для съемки даже короткого ролика нужна была команда специалистов, теперь это можно сделать с телефона с помощью нескольких фраз.

Проблемой становится дезинформация. Чтобы предотвратить злоупотребления, OpenAI внедрила фильтр Likeness Misuse, который блокирует попытки создания видео с реальными людьми без их согласия. Если пользователь вводит имя публичного лица, система либо отклоняет запрос, либо возвращает ошибку.

В версии Sora 2 появилась функция Cameo, позволяющая пользователю загрузить собственное изображение для создания AI-аватара с контролем над его использованием. Вскоре после запуска Cameo подала иск против OpenAI, заявив, что такая функция может вводить пользователей в заблуждение относительно связи между брендами.

Система изначально имела политику » opt-out” для защищенных авторским правом персонажей, когда правообладатели сами должны были требовать исключения своих материалов. После волны критики OpenAI объявила о переходе к более контролируемой модели, более близкой к “opt-in” – то есть контент может использоваться только после получения разрешения.

Юристы отмечают, что несмотря на новые фильтры, обход системы иногда возможен, а правовой статус созданных материалов остается неопределенным. В частности, сложно получить авторское право на полностью созданные ИИ видео, поэтому компаниям рекомендуется добавлять человеческий вклад в готовые работы.

Этическое измерение

По мнению экспертов, OpenAI должен сосредоточиться на продуктах, которые служат общественным целям, а не только прибыли. Если генерация видео станет массовой, это радикально изменит не только экономику производства контента, но и само понятие достоверности.

Генеративные модели, которые когда – то создавали забавные картинки, теперь переходят к полноценному видео, и это означает, что мир цифрового искусства, медиа и восприятия реальности вступает в новую фазу-с новыми возможностями, но и новыми рисками.

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Євген
Євген
Евгений пишет для TechToday с 2012 года. По образованию инженер,. Увлекается реставрацией старых автомобилей.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися

Статті