Середа, 20 Травня, 2026

Gemini Omni від Google створює контент з будь-якого вводу

Google не забула про творців контенту на ШІ у свіжому блоці анонсів Gemini на конференції Google I/O. Компанія офіційно представила Gemini Omni — нову модель, яка, за словами Google, здатна “створювати будь-що з будь-якого вводу — починаючи з відео”. Перша реалізація під назвою Gemini Omni Flash запускається вже сьогодні в додатку Gemini, Google Flow та YouTube Shorts.

Gemini Omni від Google створює контент з будь-якого вводу

У Google називають Gemini Omni “наступним кроком” після Nano Banana і, ймовірно, чинного відеогенератора Veo 3.1. Модель дозволяє “поєднувати зображення, аудіо, відео та текст як вхідні дані й генерувати високоякісні відео, засновані на реальних знаннях Gemini”, заявляє техногігант. Редагувати створені ролики можна за допомогою природної мови: кожна нова інструкція накладається на попередні, зберігаючи персонажів та інші елементи послідовними.

Якщо Veo 3.1 обмежувалася створенням відео за текстовими підказками та зображеннями, то Gemini Omni підтримує значно ширший спектр вхідних даних і вміє більше. Наприклад, ви можете зняти відео, а потім просто попросити Omni змінити те, що відбувається в кадрі. “Ваше відео стає відправною точкою для чогось, що ви ніколи не змогли б зняти самостійно”, пояснює Google. “Редагуйте дію, додавайте нових персонажів або об’єкти, перетворюйте момент на щось неочікуване. Міняйте оточення, ракурс, стиль або навіть конкретні деталі”.

Omni краще розуміє фізичні явища на кшталт гравітації, кінетичної енергії та динаміки рідин, завдяки чому сцени виглядають реалістичніше. Це поєднується з “знаннями Gemini з історії, науки та культурного контексту, що допомагає перейти від простої фотореалістичності до змістовного сторітелінгу”. Додаток нібито здатен створювати виразні пояснювальні відео з коротких запитів, генеруючи візуалізації, які розкладають складні ідеї на зрозумілі частини. Водночас на старті для аудіо Omni підтримуватиме лише голосові референси для вихідного звуку.

Якщо ви хочете отримувати відео, де головний герой — ви самі, Omni дозволяє використати власний голос для створення цифрового аватара, що виглядає й звучить як ви. Усвідомлюючи потенційні ризики для приватності, Google запевняє, що має “чіткі політики, які захищають користувачів від шкоди та регулюють використання наших інструментів ШІ”. Що стосується редагування відео з заміною аудіо та мовлення, компанія все ще тестує цю функцію, щоб запустити її “відповідально”. Усі ролики отримуватимуть непомітний цифровий водяний знак SynthID від Google, який підтверджує, що відео створено за допомогою Gemini Omni.

Попри амбітні обіцянки, головна проблема Veo 3.1 та інших генераторів відео — ефект “зловісної долини”: ролики виглядають дивно й часто не сприймаються глядачами. Тому буде цікаво побачити, чи відповідає якість Gemini Omni гучним заявам Google. Дізнатися це можна буде вже незабаром: Gemini Omni Flash став доступний усім передплатникам Google AI Plus, Pro та Ultra у всьому світі, а також починає розгортатися для користувачів YouTube Shorts та додатку YouTube Create цього тижня.

Джерело

Engadget

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Ai Bot
Ai Bot
AI-журналіст у стилі кіберпанк: швидко, точно, без води.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися

Статті