З появою доступних онлайн генераторів зображень на базі ШІ, що стають дедалі потужнішими, відрізнити автентичне фото від штучного щораз складніше. У вівторок OpenAI оголосила про два нові інструменти, що мають допомогти боротися з цією проблемою.
Компанія приєднується до відкритого стандарту C2PA, який додає чіткий сигнал у метадані файлу про те, що зображення було створене за допомогою ШІ. Крім того, OpenAI співпрацює з Google для впровадження невидимого водяного знака SynthID, який складніше виявити, але й важче видалити, якщо зловмисники спробують приховати сліди.
Нові засоби захисту застосовуються лише до зображень, згенерованих продуктами OpenAI, тож вони не вплинуть на потік контенту з менш надійних інструментів. Водночас це дозволяє принаймні гарантувати, що OpenAI не посилює проблему.
OpenAI також готує публічний інструмент перевірки, який шукатиме обидва сигнали й дозволить користувачам легко перевіряти, чи було зображення створене ШІ. Спочатку він працюватиме лише з контентом, згенерованим продуктами OpenAI, але з часом компанія хоче розширити його й на інші інструменти.
Коаліція з підтвердження походження та автентичності контенту (C2PA) — це некомерційна організація, заснована у 2021 році для протидії шкідливому впливу ШІ-зображень на публічний дискурс. Стандарт C2PA уже впроваджено в низці продуктів Google, але загалом по індустрії його застосування залишається нерівномірним. Оскільки сигнал C2PA зберігається у відкритих метаданих файлу, його можна змінити або видалити, тож він найкорисніший у середовищі довірених учасників.
SynthID — новіша розробка, покликана бути стійкішою до втручань. Створений Google водяний знак SynthID має зберігатися навіть у разі спроб видалити його — через скриншоти, зміну розміру чи цифрову обробку зображення.
Обидві системи мають доповнювати одна одну, компенсуючи слабкі місця кожної.
«Водяні знаки можуть бути стійкішими до трансформацій, як-от скриншоти, тоді як метадані здатні містити більше інформації, ніж сам водяний знак, — зазначає OpenAI в анонсі. — Разом вони роблять підтвердження походження контенту надійнішим, ніж кожен з цих підходів окремо».
На конференції Google I/O 2026 компанія представила нову версію свого агентного застосунку для програмування Google Antigravity 2.0 з оновленим десктопним застосунком, CLI-інструментом та SDK для створення кастомних робочих процесів. Минулого року Google запустила Antigravity як відповідь на агентні IDE на кшталт Cursor.
У компанії зазначають, що завдяки новому десктопному застосунку користувачі можуть оркеструвати кілька агентів і виконувати завдання паралельно. Також можна проєктувати власні робочі процеси для субагентів і планувати завдання, які автоматично виконуються у фоновому режимі. Оновлений застосунок спрощує інтеграцію проєктів з Google AI Studio, Android та Firebase.
Більшість нових можливостей працює на базі моделі Gemini 3.5 Flash, яку, за словами Google, спільно розробляли із використанням Antigravity.
Google також додає в Antigravity нативну підтримку голосових команд — так само, як це вже реалізовано в низці споживчих продуктів компанії, зокрема в Gmail та Docs. Крім того, запускається новий CLI-інструмент Antigravity (інтерфейс командного рядка) для розробників, які віддають перевагу терміналу для створення агентів. Користувачам попереднього інструмента Gemini CLI радять перейти на новий.
Окремо Google запускає SDK Antigravity, щоб розробники могли створювати кастомні агентні рішення на базі цього інструмента для коду. Клієнти Google Cloud зможуть під’єднуватися до Antigravity для побудови власних проєктів. Компанія також пообіцяла опублікувати шаблони кастомних агентів в AI Studio, аби корпоративні користувачі могли швидко стартувати.
До AI Studio також додають інструмент експорту в Antigravity, який дозволяє розробникам вивантажити наявний проєкт і продовжити роботу локально.
Google використовує можливості Antigravity для написання коду й у споживчих продуктах, зокрема в Пошуку. Користувачі отримуватимуть згенерований у реальному часі спеціальний інтерфейс як частину відповіді. У межах такого інтерфейсу, за словами компанії, можна буде створювати мінізастосунки прямо під час дослідження теми в пошуку.
Також Google запроваджує новий тарифний план AI Ultra вартістю $100 на місяць, який дає в 5 разів вищі ліміти використання ШІ в Antigravity, ніж план Pro.
Крім цього, компанія знижує вартість свого топового плану AI Ultra з $250 до $200 на місяць. Він забезпечує 20-кратне підвищення лімітів порівняно з Pro. Інші AI-лабораторії, зокрема Anthropic та OpenAI, останніми роками також запровадили плани по $100 і $200 на місяць, формуючи багаторівневу систему для користувачів з різними обсягами використання ШІ.
На конференції розробників Google I/O компанія оголосила, що додає функцію голосових підказок у додатки Workspace – зокрема Docs, Keep та Gmail. Ці можливості допоможуть створювати чернетки, робити нотатки та шукати листи.
У Docs тепер можна створити чернетку документа за допомогою голосу. У демонстрації Google показала, як користувач може витягнути дані резюме з Drive, додати до документа логістику заходу з email-листа і навіть включити кілька кумедних історій.
Раніше все це потрібно було надрукувати вручну, і часто користувачі писали короткі фрази з численними уточненнями, перетворюючи процес на багатоходову розмову, що займала час. Ідея Google полягає в тому, що з голосом ви можете відразу формулювати довгі речення або просити виконати кілька завдань за один раз. Крім того, функція розуміє, коли ви змінюєте думку і просите змінити якусь деталь у межах тієї ж репліки.
Генеральний директор Google Сундар Пічаї сказав, що в майбутньому користувачі зможуть створювати та редагувати документи повністю голосом.
Окрім цього, Google додає можливість «виговорити» свої думки в Keep, а програма за допомогою ШІ перетворить розшифровку на структуровану нотатку або список. Подібні функції кілька років тому з’явилися в застосунках для нотаток Voicenotes та AudioPen. Нещодавно диктувальні сервіси Wispr Flow, Monologue та Aqua інтегрували таку можливість у свої голосові інструменти введення тексту.
На початку цього місяця Google випустила власний продукт для диктування Rambler, вбудований у клавіатуру Gboard і сумісний із різними додатками.
Крім Docs і Keep, компанія додає голосовий функціонал до Gmail. Завдяки новій можливості користувачі зможуть спілкуватися з Gemini та запитувати, наприклад, час наступного рейсу, код бронювання Airbnb чи час візиту до лікаря.
Технологічні компанії масово вбудовують ШІ в усі продукти й функції, і в результаті користувачі звикають ставити довші й складніші запити.
У багатьох випадках голос є зручнішим методом введення для довгих фраз та запитів, що описують складні багатокрокові дії. До того ж поточне покоління моделей уже достатньо добре розуміє, коли користувач змінює думку посеред речення, і формує підсумковий запит відповідно. Google реагує на цю тенденцію та розширює набір голосових можливостей у своїх додатках.
У перегонах за створення переконливих персональних AI‑агентів Google може мати недооцінену перевагу: компанія вже має доступ до вашої електронної пошти.
На конференції для розробників Google I/O у вівторок компанія анонсувала нового агентного персонального асистента Gemini Spark, створеного на базі моделей Gemini та агентного каркаса Google Antigravity.
CEO Alphabet Сундар Пічаї описав Spark як наступну еволюцію «розумних» цифрових асистентів, що використовують агентний AI для виконання довгострокових завдань з мінімальним контролем з боку користувача.
“Це ваш персональний AI‑агент, який допомагає орієнтуватися у вашому цифровому житті, діючи від вашого імені та за вашими вказівками”, — сказав Пічаї під час попереднього брифінгу продукту для журналістів. “Він працює на виділених віртуальних машинах у Google Cloud безшовно, тож вам не потрібно тримати ноутбук увімкненим, щоб переконатися, що він працює”.
Spark продовжує хвилю популярних агентних продуктів від великих AI‑лабораторій, зокрема Claude Cowork від Anthropic та агент ChatGPT від OpenAI. Водночас особливу цінність йому має додати глибока інтеграція з ширшою екосистемою сервісів Google. Spark «з коробки» працює з Gmail, Google Docs та іншими продуктами Google Workspace, позбавляючи користувачів необхідності самостійно налаштовувати підключення та дозволи для сторонніх застосунків.
Користувачі зможуть надсилати листи Spark безпосередньо на окрему адресу в Gmail, а агент взаємодіятиме з інтернетом через Chrome. На смартфонах прогрес виконання завдань агентом можна буде відстежувати через нову систему Android Halo.
“Потрібно надіслати керівнику лист зі статусом проєкту? Spark може зібрати всі факти з ваших листів, документів, таблиць і презентацій та підготувати чернетку за вас”, — пояснив Джош Вудворд, віцепрезидент Google Labs з напрямку Gemini App та AI Studio. “Малий бізнес уже використовує Spark. Агент може стежити за їхньою вхідною поштою, щоб вони ніколи не пропустили запит від клієнта”.
Як і інші агентні асистенти, Spark можна інтегрувати з широким спектром сервісів через MCP, і Google очікує розширення кількості таких підключень у найближчі місяці.
Наразі Spark проходить внутрішнє тестування в Google; компанія планує відкрити доступ до нього передплатникам тарифу Google AI Ultra вже наступного тижня.
Окрім власних інструментів «vibe-coding» для розробки під Android, Google оголосила, що запропонує засоби, які дозволять AI-агентам — таким як Claude Code, OpenAI Codex, а також власні Antigravity чи Gemini в Android Studio — прискорювати створення Android-додатків.
На щорічній конференції розробників Google I/O у вівторок компанія повідомила, що її Android CLI (інтерфейс командного рядка) досяг стабільної версії 1.0 і вже може використовуватися тими, хто залучає AI-агентів для розробки — незалежно від того, яку платформу програмування вони віддають перевагу.
Таким кроком Google визнає, що сьогодні багато хто створює застосунки для Android за допомогою AI-агентів, які не належать самій компанії. Вона намагається зробити свою спеціалізовану експертизу, зокрема ту, що вбудована в Android Studio, більш доступною.
З Android CLI AI-агенти можуть отримувати знання про розробку під Android за допомогою нової команди “android studio”, яка відкриває доступ до можливостей Android Studio під час створення проєкту. Далі агенти зможуть використовувати широкий набір інших команд і інструментів.
За словами Google, її агентна платформа розробки Google Antigravity включатиме додатковий пакет, що встановлює інструменти та знання, які містяться в Android CLI. Завдяки цьому Antigravity також зможе виконувати ключові завдання для розробки Android-додатків.
Бум AI-кодингу тепер напряму дістається й до розробки Android-застосунків. У вівторок на Google I/O 2026 компанія анонсувала нові можливості нативного створення Android-додатків у вебсервісі Google AI Studio. Процес, який раніше зазвичай займав тижні налаштувань і написання коду, тепер можна виконати за лічені хвилини.
Компанія також повідомила, що користувачі зможуть використовувати Gemini AI для пошуку потрібних їм застосунків як у Google Play, так і в інтернеті, що розширює можливості розробників щодо виявлення їхніх аплікацій.
У Google кажуть, що нові можливості можуть стати у пригоді як досвідченим розробникам, які хочуть швидко створювати прототипи, так і новачкам, що роблять свій перший додаток.
Надаючи змогу умовно «виб-кодити» Android-додатки через вебінструменти, Google посилює конкуренцію з іншими AI-платформами для розробки, такими як Cursor, Replit, Lovable, Claude Code та інші, і водночас відкриває Android-розробку для нового типу користувачів — нетехнічних креаторів. Це також продовження попередніх ініціатив Google із додавання AI-кодингу на базі Gemini в настільну версію Android Studio.
За словами компанії, застосунки створюються мовою програмування Kotlin з використанням інструментарію Jetpack Compose та підтримкою інтеграції з апаратними сенсорами, такими як GPS, Bluetooth і NFC. Водночас наразі такі проєкти призначені лише для особистого використання: можливість офіційного публікування додатків для родини та друзів ще в розробці.
Google пропонує використовувати технологію для створення персональних утиліт і простих соціальних застосунків, досвідів із використанням «заліза» та AI-сценаріїв.
Поки що охочі створити свій додаток можуть використовувати вбудований Android Emulator прямо в браузері, щоб переглядати й тестувати застосунок у процесі розробки. Далі користувач може встановити додаток на свій Android-смартфон через USB-кабель, підключений до комп’ютера, за допомогою вбудованого Android Debug Bridge (adb).
Ті, хто хоче розвивати свій проєкт далі, можуть скористатися тим, що AI Studio автоматично створює картку застосунку, формує пакет і завантажує його на внутрішній тестовий трек у Google Play Console для розробників. Це дозволяє користувачам продовжувати ітерації над своїм додатком і паралельно оновлювати його на власних пристроях.
Якщо ж наступний крок — публікація застосунку для ширшої аудиторії, цю версію проєкту можна передати в Android Studio: достатньо завантажити zip-файл і експортувати його безпосередньо на GitHub. З часом Google планує дозволити креаторам публікувати свої додатки для родини та друзів, а також додати підтримку інтеграцій з Firebase (Firestore, Firebase Auth, Firebase App Check та інші інструменти).
Таким чином компанія уявляє екосистему Android-додатків, де користувачі знаходять застосунки в колі власних друзів і знайомих, а не лише через Google Play.
Водночас для Play Store Google також насичує пошук штучним інтелектом.
Новий AI-оверлей “Ask Play” дозволить користувачам відкривати для себе нові застосунки через природні діалоги з ШІ прямо в Google Play.
Ще важливіше те, що додатки почнуть показуватися у відповідях віртуального асистента Google Gemini, завдяки чому розробники зможуть отримати доступ до аудиторії з мільйонів користувачів. Це оновлення запрацює протягом найближчих тижнів у Gemini у вебі та на Android. Пізніше цього року Gemini також почне «підтягувати» дані про понад 450 000 фільмів і серіалів, а також інформацію про трансляції спортивних подій, і зможе напряму переадресовувати користувачів із їхніх запитів до відповідних Android-додатків із потрібним контентом.
Попри те, що минулого тижня Google уже попередньо розкрила частину Android-новин, анонс власне нативної розробки Android-додатків у AI Studio компанія приберегла до офіційного старту щорічної конференції розробників Google I/O. Це свідчить про те, що в Google розглядають цей крок як одну з ключових новин, тісно пов’язаних з баченням «AI у реальному житті» — головною темою цьогорічного заходу, де штучний інтелект став частиною майже всіх продуктів компанії: від офісних застосунків і пошуку до мобільних сервісів та інструментів для розробників.
Поки Google запускає нові моделі та інструменти для генерування контенту за допомогою ШІ, компанія водночас полегшує користувачам відповідь на запитання «чи це створено штучним інтелектом?». Google розширює свою систему виявлення ШІ SynthID, тож такі функції, як Circle to Search та Lens, зможуть визначати зображення, створені або відредаговані ШІ.
SynthID — це власна система водяних знаків Google, яка додає невидимі метадані до контенту, створеного чи зміненого її інструментами ШІ. Торік на I/O компанія представила окремий детектор SynthID, а згодом інтегрувала цю функцію в застосунок Gemini. Тепер Google розширює можливості виявлення ШІ й на Google Chrome та Пошук.
Після оновлення користувачі зможуть перевіряти походження зображення за допомогою кількох методів. На Android Circle to Search від Google зможе позначати контент, створений ШІ. Google Lens і версія Gemini в Chrome також зможуть відповідати на запити на кшталт «чи це згенеровано ШІ?». За даними Google, ці інструменти зможуть надавати детальну інформацію про конкретне зображення. В одному з прикладів компанія показує, що може вказати: фото спочатку було зняте на смартфон Pixel, а пізніше відредаговане інструментами з підтримкою ШІ в застосунку Google Photos.
Втім, Google не завжди зможе надавати настільки деталізовані дані про кожне потенційно змінене ШІ зображення, з яким ви можете зіткнутися. Компанія додала так звані content credentials (окрема, галузева стандартна система водяних знаків) до рідного застосунку камери в лінійці Pixel 10 і тепер розширює цю технологію на моделі Pixel 8 і 9. Однак, хоча Google має дуже повну інформацію про походження зображень, знятих і відредагованих її власними інструментами, вона може бути менш надійною, коли йдеться про виявлення контенту, створеного на інших платформах ШІ.
У цьому контексті Google повідомляє, що OpenAI, Kakao та ElevenLabs погодилися впроваджувати «технологію SynthID для більшої частини їхнього ШІ‑згенерованого контенту». У блозі OpenAI зазначається, що інтеграція розпочнеться із зображень, створених за допомогою «ChatGPT, Codex або OpenAI API». Google також розширює підтримку content credentials, що має зробити виявлення ШІ більш універсальним. Застосунок Gemini отримає підтримку content credentials, починаючи з сьогоднішнього дня, а інтеграція в Chrome і Пошук очікується «впродовж найближчих місяців».
Google анонсувала низку оновлень сервісу Shopping, серед яких найпомітнішою є нова функція Universal Cart. Це інструмент, що об’єднує всі ваші покупки «під одним дахом» і дає змогу зручніше купувати товари з різних магазинів. Фактично ви зможете додавати продукти до цього кошика з будь-якого кута «маєтку» Google – пошуку, YouTube та Gmail.
Щойно ви додасте товар до кошика, «агентний» ШІ системи почне шукати для нього найнижчу ціну, аналізувати цінові тренди та підказувати, де потрібні вам речі є в наявності.
Одна з ключових переваг Universal Cart у тому, що його спроєктовано так, аби попереджати про проблеми, про які ви могли й не задуматися. У прикладі компанії користувач збирає кастомний ПК і замовляє комплектуючі в різних ритейлерів. Якщо кошик виявить проблему – наприклад, несумісність двох компонентів, – він попередить про це ще до того, як ви введете платіжні дані.
Якщо ви користуєтеся Google Wallet, система також знатиме, у яких продавців ви купуєте найчастіше, де маєте програми лояльності, і намагатиметься підсвічувати можливості додаткової економії чи максимізації бонусів.
Коли ви будете готові до оплати, інтерфейс між Google Shopping і сайтом продавця має бути максимально безшовним. Особливо швидким та зручним процес буде в тих ритейлерів, які підтримують Google Wallet, зокрема Nike, Sephora, Target, Fenty та Steve Madden.
Universal Cart почнуть поступово запускати в екосистемі Google цього літа. Спершу функція з’явиться в Shopping, Пошуку та Gemini, а пізніше протягом року – у YouTube та Gmail.
Google на конференції I/O 2026 оголосила про низку оновлень, пов’язаних зі штучним інтелектом, і водночас зробила доступ до них дешевшим. Вартість найвищого рівня підписки на її AI-сервіси зменшили удвічі. Раніше план Google AI Ultra коштував $250 на місяць, тепер його можна оформити за $100.
Усі три рівні підписки включають базові можливості, зокрема доступ до Gemini 3.5 Flash і додатка Gemini з моделлю Omni.
План AI Pro за $20 на місяць надає розширений доступ до цих основних сервісів, а також включає підписку YouTube Premium Lite і в майбутньому — Google Photos у Workspace.
За $100 на місяць у тарифі Ultra користувачі отримують у п’ять разів вищі ліміти використання порівняно з AI Pro, підписку YouTube Premium Lite та майбутній доступ до Gemini Spark. Разом із зниженням ціни зменшився й ліміт хмарного сховища: раніше користувачам Ultra було доступно до 30 ТБ, тепер — 20 ТБ.
Google представила лінійку Gemini 3.5, почавши з моделі Gemini 3.5 Flash, яка, за обіцянками компанії, перевершує Gemini 3.1 Pro у реальних агентних завданнях і задачах програмування. «3.5 Flash забезпечує інтелект рівня передових моделей на винятковій швидкості — відтепер вам не потрібно жертвувати якістю заради низької затримки».
Анонсована на Google I/O 2026, Gemini 3.5 Flash стане стандартною моделлю ШІ Google (її не варто плутати з Flash-Lite). Вона розроблена для того, щоб забезпечити вищу швидкість порівняно з актуальними моделями Gemini Pro за більш доступною ціною. Компроміс — нижча продуктивність, ніж у майбутньої Gemini 3.5 Pro (очікується наступного місяця), у задачах, які потребують глибокого міркування та розуміння дуже великого контексту.
Водночас Google скоротила розрив між версіями Pro та Flash, заявляючи, що Gemini 3.5 Flash «забезпечує інтелект, який за багатьма параметрами конкурує з великими флагманськими моделями». Вона перевершує поточну модель Gemini 3.1 Pro в бенчмарках програмування та агентних можливостей, зокрема Terminal-Bench 2.1 (76,2%), MCP Atlas scaled tool use (83,6%), а також у мультимодальному розумінні, показавши 84,2% у тесті CharXiv Reasoning. За кількістю вихідних токенів на секунду Gemini 3.5 Flash, за даними Google, у чотири рази швидша за інші передові моделі.
Усе це робить 3.5 Flash придатною для довготривалих агентних задач, які раніше могли займати тижні, а тепер виконуються «за частку цього часу», пише Google. «Під наглядом вона надійно виконує багатокрокові робочі процеси та завдання з програмування, зберігаючи продуктивність рівня передових моделей». Компанія додала, що партнери, зокрема банки та фінтех-компанії, вже використовують її для автоматизації багатотижневих процесів.
Google зазначає, що 3.5 Flash тепер є моделлю за замовчуванням для застосунку Gemini та режиму AI Mode у Пошуку по всьому світу. Персональний ІІ-агент Gemini Spark, який сьогодні починає розгортатися для тестувальників, також працює на 3.5 Flash. Паралельно Google посилила кіберзахист і CBRN-запобіжники (хімічна, біологічна, радіологічна, ядерна безпека) в Gemini 3.5, щоб модель рідше генерувала шкідливий контент або помилково відмовлялася відповідати на безпечні запити. Окремим дописом у блозі Google детально описала розширені агентні можливості Gemini 3.5 у сфері програмування.
Gemini 3.5 Flash вже «доступна для широкого використання через Google Antigravity, API Gemini в Google AI Studio та Android Studio, платформу Gemini Enterprise Agent Platform і сервіс Gemini Enterprise. Вона також вже доступна всім користувачам у застосунку Gemini та в AI Mode у Пошуку», заявили в Google.
Поки що компанія не розкриває ціни платних тарифів. Щодо Gemini 3.5 Pro, Google повідомляє: «Модель вже використовується всередині компанії, і ми з нетерпінням чекаємо на її публічний реліз наступного місяця».
Google не забула про творців контенту на ШІ у свіжому блоці анонсів Gemini на конференції Google I/O. Компанія офіційно представила Gemini Omni — нову модель, яка, за словами Google, здатна “створювати будь-що з будь-якого вводу — починаючи з відео”. Перша реалізація під назвою Gemini Omni Flash запускається вже сьогодні в додатку Gemini, Google Flow та YouTube Shorts.
У Google називають Gemini Omni “наступним кроком” після Nano Banana і, ймовірно, чинного відеогенератора Veo 3.1. Модель дозволяє “поєднувати зображення, аудіо, відео та текст як вхідні дані й генерувати високоякісні відео, засновані на реальних знаннях Gemini”, заявляє техногігант. Редагувати створені ролики можна за допомогою природної мови: кожна нова інструкція накладається на попередні, зберігаючи персонажів та інші елементи послідовними.
Якщо Veo 3.1 обмежувалася створенням відео за текстовими підказками та зображеннями, то Gemini Omni підтримує значно ширший спектр вхідних даних і вміє більше. Наприклад, ви можете зняти відео, а потім просто попросити Omni змінити те, що відбувається в кадрі. “Ваше відео стає відправною точкою для чогось, що ви ніколи не змогли б зняти самостійно”, пояснює Google. “Редагуйте дію, додавайте нових персонажів або об’єкти, перетворюйте момент на щось неочікуване. Міняйте оточення, ракурс, стиль або навіть конкретні деталі”.
Omni краще розуміє фізичні явища на кшталт гравітації, кінетичної енергії та динаміки рідин, завдяки чому сцени виглядають реалістичніше. Це поєднується з “знаннями Gemini з історії, науки та культурного контексту, що допомагає перейти від простої фотореалістичності до змістовного сторітелінгу”. Додаток нібито здатен створювати виразні пояснювальні відео з коротких запитів, генеруючи візуалізації, які розкладають складні ідеї на зрозумілі частини. Водночас на старті для аудіо Omni підтримуватиме лише голосові референси для вихідного звуку.
Якщо ви хочете отримувати відео, де головний герой — ви самі, Omni дозволяє використати власний голос для створення цифрового аватара, що виглядає й звучить як ви. Усвідомлюючи потенційні ризики для приватності, Google запевняє, що має “чіткі політики, які захищають користувачів від шкоди та регулюють використання наших інструментів ШІ”. Що стосується редагування відео з заміною аудіо та мовлення, компанія все ще тестує цю функцію, щоб запустити її “відповідально”. Усі ролики отримуватимуть непомітний цифровий водяний знак SynthID від Google, який підтверджує, що відео створено за допомогою Gemini Omni.
Попри амбітні обіцянки, головна проблема Veo 3.1 та інших генераторів відео — ефект “зловісної долини”: ролики виглядають дивно й часто не сприймаються глядачами. Тому буде цікаво побачити, чи відповідає якість Gemini Omni гучним заявам Google. Дізнатися це можна буде вже незабаром: Gemini Omni Flash став доступний усім передплатникам Google AI Plus, Pro та Ultra у всьому світі, а також починає розгортатися для користувачів YouTube Shorts та додатку YouTube Create цього тижня.
Google на щорічній конференції розробників I/O оголосила про кілька оновлень для застосунку Gemini. Зокрема, з’явилася нова дизайн‑мова під назвою Neural Expressive, яка приносить перероблений інтерфейс з оновленою типографікою, плавнішими анімаціями та тактильним відгуком. Компанія також інтегрувала функцію Gemini Live в основний інтерфейс сервісу.
Зараз, щоб говорити з ШІ голосом, потрібно натиснути кнопку Live, але після редизайну можна буде легко перемикатися між введенням тексту та розмовою з чат-ботом. Google також додає регіональні діалекти для Gemini та оформлює відповіді із використанням зображень, графіки та навіть озвучених відео, щоб уникати «стіни тексту». Оновлений чат-бот уже починає розгортатися по всьому світу на Android та iOS.
Новий агент ШІ під назвою Daily Brief також стає доступним з сьогоднішнього дня. Якщо користувач погодиться, Daily Brief збирає у фоновому режимі інформацію з усіх підключених застосунків, зокрема Gmail і Calendar, щоб сформувати зведення ваших справ на день і невідповілених повідомлень. Окрім швидкого огляду листів і майбутніх подій, агент може розставляти пріоритети завдань на день відповідно до ваших цілей і пропонувати наступні кроки. Поведінку агента можна «натренувати», оцінюючи його відповіді позначками «подобається» або «не подобається». Daily Brief починають запускати сьогодні, спочатку у США, у складі підписок Google AI Plus, Pro та Ultra.
Google також представила нову модель під назвою Gemini Omni, яка поєднує текстові підказки, зображення та завантажені відео для створення відеоконтенту. Користувачі можуть змінювати фони відео за допомогою текстових команд, застосовувати ефекти та вбудовані шаблони. Якщо потрібно вставити себе у відео, модель здатна створити аватар, який виглядає та звучить як ви. Нова модель стає доступною вже сьогодні всім передплатникам Google AI Plus, Pro та Ultra.
Ще один новий агент — Gemini Spark, який компанія описує як «особистого ШІ‑агента, доступного 24/7». Він працює на базі Gemini 3.5 і глибоко інтегрований із застосунками Workspace, такими як Gmail, Docs і Slides. Також його можна пов’язати з іншими сервісами на кшталт Canva, OpenTable та Instacart. Spark можна використовувати для регулярних завдань, наприклад, щомісячного аналізу виписок з кредитної картки в пошуках прихованих підписок. Також з його допомогою можна будувати повні робочі процеси. Наприклад, Spark здатен зібрати нотатки з інформації в листах і чатах, підготувати звіт у Google Docs, а потім на основі цього чернетку листа з пропозицією нового проєкту. Цього тижня Spark стане доступним тестувальникам, а згодом вийде для бета-передплатників Google AI Ultra у США.
На конференції Google I/O у вівторок компанія представила кардинальне оновлення Пошуку на основі ШІ, зосереджене навколо переосмисленого «розумного пошукового рядка». У Google це називають найбільшою зміною головного входу в інтернет з моменту появи пошукового рядка понад 25 років тому.
Замість простої видачі списку посилань Google Search у багатьох випадках тепер переноситиме користувачів у інтерактивні досвіди на основі ШІ. Google також запускає інструменти, які можуть відправляти «інформаційних агентів» збирати дані від імені користувача, а також інструменти для створення персоналізованих мінідодатків під конкретні потреби.
У підсумку новий досвід пошуку буде дедалі менше схожим на звичний Google Search, який роками асоціювався з ранжованими посиланнями на сайти з потрібною інформацією.
Оновлений пошуковий досвід передбачає, що новий пошуковий рядок просто розширюється під довші, розмовні запити — замість того, щоб змушувати користувача одразу вибирати тип або режим пошуку. У ньому також з’явиться нова система підказок на основі ШІ, яка вийде за межі звичного автодоповнення та, за словами Google, допомагатиме людям формулювати складніші й нюансованіші запити.
AI Overviews від Google також дозволять користувачам ставити додаткові запитання в AI Mode, починаючи з вівторка, зазначила компанія.
Google впроваджує в пошук агентні можливості та інтерактивні функції на основі ШІ. Це означає, що люди ще менше часу проводитимуть, клацаючи по традиційних синіх посиланнях, які раніше повертав Google Search.
Від цього літа користувачі зможуть створювати, налаштовувати й керувати кількома новими «інформаційними агентами» безпосередньо в Google Search. Ці агенти можуть працювати у фоновому режимі 24/7, відстежуючи зміни в інтернеті й сповіщаючи про нову інформацію. Наприклад, можна доручити агенту відстежувати рухи ринку за заданими користувачем параметрами, пропонує Google.
Хоча базова технологія тут — це ШІ, що робить систему значно потужнішою, сама ідея не є новою.
Ще у 2003 році Google запустила Google Alerts — сервіс виявлення змін, який надсилав листи, коли у вебі з’являлися нові результати за заданими пошуковими термінами. Тоді інтернет був меншим і більш керованим, тож цей інструмент увійшов до стандартного набору багатьох фахівців з інформації. (Сервіс і досі існує в тій чи іншій формі, але вже не є основним способом отримання нових даних для більшості користувачів.)
Інформаційні агенти — це еволюція Google Alerts. Вони не лише фіксують зміни, а й уміють їх інтерпретувати.
«Ви можете створити сповіщення для відстеження рухів ринку в певному секторі за дуже конкретними параметрами, а агент побудує для вас план моніторингу, включно з інструментами та даними, до яких йому потрібно мати доступ — наприклад, до наших фінансових даних у реальному часі», — пояснила директорка з пошуку Google Ліз Рейд під час брифінгу для преси. «А далі він стежитиме за цими змінами, повідомить, коли умови будуть виконані, і надасть узагальнений огляд із посиланнями та інформацією, в яку ви зможете заглибитися», — додала вона.
Цей зсув означає, що «пошук в інтернеті» дедалі частіше виконуватимуть не люди, а агенти ШІ. Користувачі більше зосереджуватимуться на тому, щоб діяти на основі наданої агентами інформації, а не вручну переходити за посиланнями.
Посилання дедалі більше відходитимуть на другий план у новому досвіді сторінки результатів пошуку. Він спирається на раніше запущені функції Google на основі ШІ — короткі підсумки AI Overviews та розмовний режим пошуку AI Mode.
AI Overviews вже використовують понад 2,5 мільярда користувачів щомісяця; водночас розмовний режим пошуку, запущений торік, перетнув позначку в 1 мільярд щомісячних користувачів. (Для порівняння: у ChatGPT, за даними на початок цього року, 900 мільйонів щотижневих активних користувачів. Це свідчить, що ChatGPT бачить частішу взаємодію — люди повертаються кілька разів на тиждень, тоді як у Google більше унікальних користувачів, які взаємодіють з функціями ШІ протягом місяця.)
Тепер, завдяки поєднанню Gemini та Google Antigravity — платформи для розробки агентів, — результати пошуку почнуть дедалі більше нагадувати інтерактивні вебсторінки.
«Пошук може будувати індивідуальні сценарії саме під ваші запитання — від динамічних макетів та інтерактивної візуалізації до постійних робочих просторів для проєктів, куди ви можете повертатися знову і знову», — каже Рейд. Один зі способів інтеграції цих можливостей — «generative UI» (генеративний інтерфейс користувача), коли система на льоту формує спеціальні віджети й візуалізації у відповідь на пошукові запити.
Наприклад, запит про чорні діри в космосі може призвести до появи інтерактивної візуалізації, яка «оживляє» це поняття, каже Рейд. Користувачі можуть ставити подальші запитання й бачити, як Google у реальному часі відповідає абсолютно новими візуалізаціями.
Google зазначає, що нова система створена у співпраці з командою Google DeepMind та використовує Gemini Flash 3.5. Вона стане доступною всім користувачам Google безплатно вже цього літа.
Крім того, Google дозволить залучати Antigravity для створення власних налаштовуваних, «станних» (stateful) сценаріїв — своєрідних «мінідодатків» — безпосередньо в Пошуку за допомогою команд природною мовою. Знову ж таки, це вже менше про пошук інформації, а більше — про дії. Наприклад, можна створити застосунок для планування харчування з урахуванням вашого календаря, щоб вирішувати, що готувати і коли їсти, або фітнес-додаток під ваші конкретні цілі.
Разом ці зміни, ймовірно, ще більше зменшать обсяги трафіку з Google на сайти видавців, які й так страждають від падіння переходів через AI Overviews. Це вже поставило хрест на окремих медіа, які залежать від реклами, і тепер ситуація може лише погіршитися.
У видавців залишається небагато часу для адаптації. Оновлений пошуковий рядок з’являється вже цього тижня, а generative UI — цього літа. Обидва сервіси будуть безплатними. Функція створення мінідодатків та інформаційні агенти спершу вийдуть цього літа для передплатників Google AI Pro та Ultra.
Водночас довгостроковий план Google — зробити свою технологію ШІ більш доступною, включно з персональним AI-агентом Spark, який зрештою також стане безплатним, як і багато інших функцій ШІ.
«Частково причина, чому ми зосереджуємось на створенні передових моделей — надзвичайно потужних, але водночас ефективних, швидких і дешевших — полягає в тому, що ми хочемо донести їх до якомога більшої кількості людей. І я думаю, що саме в цьому ми зможемо вирізнятися», — сказав CEO Google Сундар Пічаї під час брифінгу перед I/O.
Майже кожен хоч раз вмикав Street View у Google Maps, щоб показати друзям, як виглядає будинок дитинства, або «кидав» фігурку на вулиці Парижа, аби перевірити, чи дійсно готель у «класному» районі. Тепер уявіть, що це можна робити значно більш занурено й інтерактивно: моделювати саму вулицю та її оточення, змінювати погоду або подивитися, як район виглядав би у сценарії на кшталт «Післязавтра».
Саме до цього веде остання інтеграція Google. Відсьогодні Google DeepMind підключає Street View до Project Genie — універсальної «моделі світу», яка вміє генерувати різноманітні інтерактивні середовища. Нову можливість представили на конференції розробників Google I/O 2026.
«Це справді потужний інструмент і для агентів та робототехніки, і для людей, щоб гратися з ним — і це завжди було головною ідеєю Genie», — розповів TechCrunch Джек Паркер-Холдер, науковий співробітник команди open-endedness у DeepMind.
Він навів приклад нового робота, якого розгортають у Лондоні, де сонце буває нечасто. Genie, каже Паркер-Холдер, може змоделювати ті рідкісні моменти, коли проміння відбивається від вікторіанських будинків, щоб робот не «шокувався», коли це станеться в реальності.
«Одночасно ви можете сказати: “Я лечу до Нью-Йорка, але не в цю пору року. Там буде сніг. Я хочу подивитися, як виглядає цей квартал узимку”», — продовжив він.
Google збирає дані Street View вже 20 років за допомогою автомобілів з камерами та людей з так званими “tracker backpacks”. Компанія накопичила понад 280 млрд зображень зі 110 країн на семи континентах.
«Зі Street View ми маємо зображення з великої частини світу, — каже Джек. — Можна уявити, наскільки потужним є поєднання цього багатого джерела реальної інформації з можливістю моделювати світи».
Останню версію моделі світу — Genie 3 — Google випустила для дослідницького прев’ю минулого серпня, а у січні відкрила доступ до інструмента для передплатників Google AI Ultra у США. Користувачі можуть створювати інтерактивні ігрові світи з текстових підказок або зображень. Мета — використовувати Genie для освітніх досвідів, ігор і тренування роботів.
Genie 3 вже допомагає працювати одному з симуляторів Waymo для тренування безпілотних авто на «надзвичайно рідкісних подіях» — на кшталт торнадо або випадкових зустрічей зі слонами. Додавання даних Street View може допомогти Waymo швидше готуватися до запуску в нових містах по всьому світу.
У Waymo є власний симулятор, завдяки якому компанія масштабувалася до 11 міст у США й протестувала свого ІІ-водія ще у кількох. Різниця з Genie, пояснює Паркер-Холдер, у тому, що симулятори Waymo працюють лише з точки зору автомобіля. Street View дозволяє не лише моделювати світ, прив’язаний до реального місця, а й змінювати точку зору на інших агентів — людину чи робота.
Запуск Street View у Genie стартує сьогодні для частини користувачів Ultra у США, надалі доступ розширюватимуть поступово. За словами компанії, глобальні передплатники Ultra отримають доступ протягом кількох тижнів.
Мета дослідників — дати нову можливість якомога більшій кількості людей, каже менеджер продукту DeepMind Дієго Рівас. Водночас він застерігає: і Street View у Genie, і сама Genie все ще експериментальні, тож точність ще потребує значного вдосконалення.
На продемонстрованих прикладах — зокрема підводній симуляції району, де журналіст раніше мешкав, — результати виглядають вражаюче й упізнавано, але все ще більше схожі на відеогру, а не на фотореалізм. Моделі поки що не «знають» фізику: не розуміють причинно-наслідкових зв’язків. Наприклад, у симуляції бігу жінки засніженим Джошуа-Трі вона просто пробігала крізь кактуси та кущі.
Для порівняння: генератор зображень Google Nano Banana вже вміє створювати ідеальний текст в інфографіці, а відеогенератор Veo розуміє, що паперові кораблики пливуть за течією, дим розсіюється в повітрі, а тканина драпірується навколо форм.
Фізика в ці моделі не «зашита» жорстко — вони вчаться їй інтуїтивно з часом, спостерігаючи за світом пасивно, подібно до живих істот.
«На мій погляд, такі моделі відстають від відео приблизно на шість–дванадцять місяців за точністю й якістю, тож, думаю, це проблема, яку ми розв’яжемо», — каже Паркер-Холдер.
Джонатан Герберт, директор Google Maps, який починав у команді Street View стажером 12 років тому, розповідає, що Genie ще не може створити повністю точну реконструкцію вулиці. На його думку, справжній прорив — у просторовій безперервності. Якщо ви повернетеся на 360 градусів, ШІ правильно «пам’ятає» та відтворює те, що залишилося позаду. Від цієї точки модель може будувати на основі вже «знаменого» оточення нове середовище.
«Ми давно думали над тим, як побудувати найкращу та найповнішу модель світу поверх даних Street View, — каже Герберт. — Ідея використовувати дані Карт по-новому й для нових напрямів ІІ-досліджень у нас вже дуже давно».
Microsoft анонсувала нові ігри, які з’являться в Xbox Game Pass до кінця травня. Найбільший реліз серед них — очікуваний автосимулятор Forza Horizon 6. Гра вже доступна для передплатників Game Pass Ultimate та PC Game Pass.
Це найсвіжіша частина довготривалої серії, і перші огляди надзвичайно схвальні. Події розгортаються в Японії, а візуальний стиль виглядає вражаюче. Наразі це головний хіт Game Pass, особливо після того, як ігри Call of Duty перестали виходити в сервісі в день релізу.
Кооперативний шутер Remnant II стане доступним у бібліотеці Ultimate, Premium та PC Game Pass 20 травня. Це шутер від третьої особи, який часто описують як «Soulslike зі зброєю» — і це визначення цілком пасує. Звичайні вороги тут доволі складні, а боси ще жорсткіші. На щастя, гра підтримує кооператив до трьох гравців одночасно.
Luna Abyss виходить у Game Pass у день релізу 21 травня для передплатників Ultimate та PC Game Pass. Це атмосферна пригодницька гра від першої особи з акцентом на сюжет, у якій гравці досліджують загадкову споруду глибоко під поверхнею Місяця.
Серед інших майбутніх поповнень — головоломка Escape Simulator, яка вийде 26 травня, та карткова тактична гра Echo Generation 2, реліз якої заплановано на 27 травня. Крім того, кілька проєктів переходять до Game Pass Premium після того, як певний час були доступні лише в Ultimate. Йдеться про Dead Static Drive, Pigeon Simulator та Winter Burrow.
Цього тижня увага технологічного світу була прикута до Маунтін-В’ю, Каліфорнія. Саме в цьому місті в Сан-Франциській затоці розташована штаб-квартира Google, тож логічно, що компанія знову провела там свою щорічну конференцію для розробників. Google I/O 2026 стартувала у вівторок із традиційної великої презентації — саме під час неї компанія зазвичай розкриває найважливіші для масової аудиторії новини.
Минулого тижня Google уже вивалив гору анонсів щодо Android, тому мобільна екосистема не була в центрі уваги. І так, фокус передбачувано змістився на ШІ. Слово «Gemini» звучало стільки разів, що рахувати не було сенсу, а оновлень у цьому напрямі справді багато.
Пошук — давній «хліб із маслом» Google — став одним із головних акцентів заходу. Компанія розповіла про нову функцію Ask YouTube, зміни в цінах на підписку на ШІ, а також нові можливості в Workspace, зокрема в Docs і Gmail.
Деталей дуже багато, тож розберімося, що саме Google анонсувала на своїй презентації I/O 2026.
Новий пошуковий рядок і «розумний» AI Mode
Якщо більшість Android-новин ми вже почули минулого тижня, настав час для іншої опори імперії Google — Пошуку. Мабуть, найбільша зміна — це оновлення пошукового рядка, який для сотень мільйонів людей десятиліттями був де-факто головною сторінкою інтернету.
Починаючи з сьогоднішнього дня Google розгортає «інтелектуальний, керований ШІ пошуковий рядок» в усіх мовах і країнах, де доступний AI Mode. За словами компанії, він пропонуватиме підказки, які «виходять за межі автодоповнення», адже рядок пошуку тепер краще розуміє наміри користувача й допомагає формулювати запити. Окрім тексту, можна буде використовувати зображення, файли, відео та навіть вкладки Chrome як вхідні дані для пошуку.
Користувачі на десктопі та мобільних пристроях по всьому світу тепер зможуть ставити уточнювальні запитання в AI Overview, а потім «сковзнути» прямо в AI Mode. Google стверджує, що чим глибше ви заглиблюєтесь у тему, тим релевантнішими стають посилання й додаткова інформація.
Поки що незрозуміло, чи завадять ці зміни різним обхідним маневрам, які багато користувачів (привіт) застосовують, щоб уникати AI Overview та інших ШІ-функцій у результатах пошуку. Не здивуємося, якщо це підштовхне ще більше людей відмовитися від Google Search на користь альтернатив із «чистим» веб-пошуком без ШІ.
Як це вже заведено, Google знову переробляє AI Mode на основі нового покоління моделей. Відсьогодні AI Mode за замовчуванням працює на базі Gemini 3.5 Flash — це найновіша Flash-модель компанії (про неї трохи далі).
Personal Intelligence стає мультимовним
Google розширює можливості Personal Intelligence в AI Mode. Ця функція дозволяє, за згоди користувача, надати Gemini доступ до даних із таких сервісів, як Gmail і Google Photos (інтеграція з Google Calendar у розробці). Ідея в тому, щоб ШІ краще розумів ваш персональний контекст.
У березні Google зробила Personal Intelligence безкоштовною для всіх користувачів у США. Від сьогодні інструмент стає доступним 98 мовами майже у 200 країнах і регіонах.
Агенти для моніторингу інформації та бронювання
Як і в Android, Google приносить у Пошук так звані агентні (agentic) функції ШІ. Серед них — «інформаційні агенти», які, за словами компанії, можуть постійно працювати у фоновому режимі й стежити за тим, що вас цікавить. Вони нібито здатні моніторити блоги, новинні сайти, оголошення нерухомості, дописи в соцмережах та інші ресурси в інтернеті, а також дані в реальному часі — з фінансів, спорту чи онлайн-шопінгу. Це дозволяє тримати користувача в курсі всього важливого. (Для онлайн-медіа, які й так уже втратили чимало трафіку через AI Overview й AI Mode, це звучить не дуже обнадійливо.)
Такі агенти можуть узагальнювати знайдену інформацію й пропонувати конкретні дії. Спочатку вони стануть доступними цього літа для передплатників Google AI Pro та Ultra.
Також цього літа всі користувачі в США зможуть спробувати агентні функції бронювання в Пошуку. Наприклад, якщо ви шукаєте приватну кімнату для караоке, де пізно ввечері ще можна замовити їжу, Пошук дослідить доступні варіанти, покаже ціни та наявність і підкаже, де завершити бронювання. У категоріях краси, догляду за тваринами, ремонту житла й деяких інших Google може навіть подзвонити до місцевих бізнесів від вашого імені, якщо ви цього хочете. Над подібними технологіями компанія працює вже багато років.
Antigravity в Пошуку: генеративний інтерфейс і мінідодатки
У Пошук Google також вбудовує проєкт Antigravity. Компанія обіцяє, що користувачі зможуть генерувати кастомні інтерфейси — наприклад, візуалізації того, як щось працює, а також таблиці, графіки й симуляції. Цей генеративний UI-інструмент стане доступним усім уже цього літа, і Google не планує брати за нього плату.
Крім того, в Пошуку з’явиться можливість створювати мінідодатки — наприклад, панелі моніторингу або трекери — для окремих задач за допомогою Antigravity. Google каже, що це допоможе при плануванні весілля, відстеженні прогресу у фітнесі тощо. Antigravity зможе підключати дані Google, такі як погода, карти в реальному часі й відгуки. Першими цю можливість отримають цього літа користувачі AI Pro та Ultra у США. Це виглядає схоже на створення кастомних віджетів в Android, про що Google оголошувала минулого тижня.
Gemini 3.5 Flash і Pro
Повернімося до Gemini 3.5. Першою моделлю з цієї серії, яку Google випускає, стала Flash. Вона вже працює в AI Mode і застосунку Gemini для всіх користувачів, а також у різних інструментах (зокрема Antigravity) для розробників і корпоративних клієнтів. Модель Gemini 3.5 Pro має з’явитися у червні.
За словами Google, Gemini 3.5 Flash — це «найпотужніша на сьогодні агентна й кодогенерувальна модель» компанії. Вона нібито допомагає розробникам виконувати задачі «в рази швидше й часто менш ніж за половину вартості інших флагманських моделей». Партнери, включно з дата-сайєнтистами, уже використовують її для отримання інсайтів із великих і складних наборів даних.
Google заявляє, що Gemini 3.5 менш схильна генерувати шкідливий контент або безпідставно відмовлятися відповідати на коректні запити. Компанія каже, що застосовує більш розвинені механізми безпеки, включно з перевіркою міркувань моделі перед тим, як вона видасть відповідь.
Gemini Omni: мультимодальний генератор відео й аватарів
Google також представила нову серію моделей штучного інтелекту — Gemini Omni. За словами компанії, Omni може «створювати що завгодно з будь-якого типу вводу». Починає вона з можливості генерувати відео на основі тексту, зображень, аудіо та інших відео. Вихідні формати зображень та аудіо з’являться пізніше.
Omni позиціонується як інструмент для більш «розмовного» редагування відео. Наприклад, компанія обіцяє, що ви зможете завантажити своє відео й попросити Omni змінити оточення, стиль, ракурс та інші деталі. Оскільки модель, за словами Google, може комбінувати будь-які типи вводу «в єдиний цілісний результат», користувачі зможуть додавати зображення персонажів, інші сцени чи навіть ескізи, які Omni враховуватиме при генерації.
Компанія також каже, що ви зможете створити аватар зі своїм голосом і «генерувати відео, які виглядають і звучать, як ви». Усі відео, створені за допомогою Omni, матимуть цифровий водяний знак SynthID, який вказуватиме, що вони зроблені моделями Google.
Першою моделлю на базі цієї технології стала Gemini Omni Flash. Вона вже доступна в застосунку Gemini та сервісі Google Flow для передплатників Google AI Plus, Pro та Ultra. Інші користувачі зможуть безкоштовно спробувати її цього тижня через YouTube Shorts і застосунок YouTube Create (про це — далі).
Gemini Spark: персональний агент у хмарі
Gemini Spark позиціонують як особистого ШІ-агента, який може виконувати завдання замість користувача. Він працює в хмарі (тобто ноутбук чи смартфон не потрібно тримати відкритими) й базується на Gemini 3.5. Spark може отримувати доступ до додатків Workspace — Gmail, Docs тощо — якщо ви погоджуєтеся це дозволити.
Google наводить приклади: Spark зможе відстежувати виписки з кредитних карт, щоб виявляти нові чи приховані підписки; моніторити листи зі школи вашої дитини; збирати з Gmail нотатки й матеріали по проєкту й оформлювати їх у документ у Docs. Перед тим як зробити щось на кшталт відправлення листа, завершення покупки чи додавання події до календаря, Spark проситиме у вас підтвердження. Агент також зможе підключатися до застосунків партнерів Google, таких як Canva, OpenTable й Instacart, та виконувати дії в них.
Цього тижня доступ до Spark отримають «надійні тестувальники», а наступного — частина передплатників Google AI Ultra у США. Бізнес-клієнти Google Workspace зможуть протестувати Spark через застосунок Gemini найближчим часом. Також Google планує цього літа додати Spark до десктопного застосунку Gemini, «щоб він міг допомагати із задачами, пов’язаними з локальними файлами, і автоматизувати робочі процеси на робочому столі».
Оновлення застосунку Gemini
Щодо самого застосунку Gemini, то й тут є новини. Окрім інтеграції Omni, Spark та Gemini 3.5, застосунок отримує візуальне оновлення на основі дизайн-системи Neural Expressive. Google описує її як яскраву й динамічну, з «плавною анімацією, насиченими кольорами, оновленою типографією та тактильним відгуком».
У застосунку з’являється Gemini Live для більш вільного спілкування — зі зміненим режимом мікрофона. За словами компанії, це дозволить «спокійно проговорювати складні ідеї у своєму темпі, не боячись, що вас обірвуть на півслові». Незабаром можна буде обирати й регіональний діалект для голосу Gemini. Відповіді ШІ не обмежуватимуться лише текстом — з’являться зображення, інтерактивні таймлайни й озвучені відео.
Функція Daily Brief зможе щоранку видавати короткий дайджест майбутнього дня. Якщо дати їй доступ до Gmail і Calendar, вона підніме дедлайни з листів та події з календаря й збере їх в одному огляді, нагадуючи про важливі справи. Daily Brief також може пропонувати наступні дії. Першими доступ до цієї функції отримують передплатники Google AI Plus, Pro та Ultra — починаючи з сьогодні.
Ask YouTube і Remix у Shorts
Передплатники YouTube Premium у США вже зараз можуть скористатися новою функцією Ask YouTube, яка незабаром стане доступною для всіх користувачів. Google подає її як «більш розмовний» спосіб пошуку по YouTube. Наприклад, можна попросити поради щодо того, як навчити дитину кататися на велосипеді, або запитати у сервісу добірку «затишних» ігор для вечірнього відпочинку.
«Ask YouTube збере найрелевантніші відео з усього каталогу YouTube — включно з довгими роликами та Shorts — і надасть інтерактивну, структуровану відповідь», — каже Google. Результати можна буде уточнювати додатковими запитаннями.
Як уже згадувалося, Omni стане доступним із сьогоднішнього дня в інструментах YouTube Shorts Remix і застосунку YouTube Create. Користувачі зможуть реміксувати Shorts, додаючи себе у відео поруч із авторами або змінюючи візуальний стиль ролика, наприклад на ретро. Такі ремікси матимуть позначки про використання ШІ та водяні знаки SynthID, а також посилання на оригінальне відео.
Автори зможуть відмовитися від того, щоб інші реміксували їхні Shorts у такий спосіб. Для всіх креаторів віком від 18 років буде доступний інструмент для виявлення використання їхньої зовнішності, який має допомогти контролювати власне зображення на платформі.
Нові ШІ-можливості в Gmail, Docs і Keep
Google інтегрує більше ШІ-функцій у Gmail, Docs і Keep. У Gmail з’явиться Gmail Live, який дозволить шукати вхідні листи за допомогою природних голосових запитів. Компанія каже, що можна буде, наприклад, запитати номер виходу на посадку для вашого рейсу або дізнатися, що відбувається в школі вашої дитини, а Gmail Live знайде відповідні листи.
Docs Live, за задумом Google, зможе перетворювати усну мову на більш охайний перший чернетковий варіант документа, структуруючи й упорядковуючи ваші думки. Якщо ви дасте на це дозвіл, інструмент зможе підтягувати релевантну інформацію з Gmail, Drive, чатів і вебу. У схожому ключі Keep Live має вміти перетворювати «потік свідомості» з вашої мови на структуровані нотатки.