Хмарна інфраструктура тривалий час проєктувалася під людей, які шукають, клікають, гортaють і стрімлять контент у відносно рівномірному й передбачуваному режимі. ШІ-агенти поводяться інакше. Вони можуть раптово створювати потужні хвилі активності, запускаючи безліч підагентів, які за секунди опитують сотні баз даних, шукають у документах і викликають API, а потім зникають так само швидко, як з’явилися.

Виходячи з цього, Amazon переробляє ключовий елемент своєї хмарної інфраструктури. У четвер AWS представила нове покоління OpenSearch Serverless — повністю керовану систему пошуку та векторну базу даних, тобто систему для масштабного зберігання й отримання інформації, спеціально спроєктовану для агентних навантажень. В AWS кажуть, що нова система може миттєво масштабуватися, коли агенти запускають задачі, і зменшувати масштаб до нуля в періоди простою.
Запуск відображає ширше усвідомлення в індустрії: інфраструктура, яку створювали для інтернету з переважно людським трафіком, гірше працює в світі, де все більше з’являється агентів.
Попри те, що ШІ-агенти поки становлять відносно невелику частку інтернет-активності, обсяг машинного трафіку вже значний і швидко зростає. За даними Cloudflare, за останні шість місяців боти забезпечили 31% усього HTTP-трафіку. Приблизно чверть усіх запитів від ботів за цей період припадала на ШІ-сканери, пошукові системи та асистентів.
«Нелюдський трафік перевищить людський десь у першій половині 2027 року», — сказала TechCrunch старша менеджерка продукту Cloudflare Лай Ї Олсен.
На нещодавній конференції розробників Google I/O компанія заявила, що користувачі зможуть делегувати ШІ-системам все більше завдань: дослідження товарів перед покупкою, бронювання подорожей, веб-перегляд і взаємодію з додатками. І це не обмежується споживчими ШІ-агентами. Підприємства дедалі активніше розгортають агентів усередині компаній і для роботи з клієнтами, створюючи нові види машинного трафіку «за лаштунками».
У результаті хмарні провайдери та інфраструктурні компанії змушені переосмислювати системи, створені під людей, для світу, де агенти постійно й автономно отримують інформацію, викликають інструменти й генерують трафік «машина до машини».
Саме для цього й створено оновлений OpenSearch Serverless від AWS.
«Час очевидний. Агенти переходять зі стадії експериментів у продакшн, і вони формують такі патерни трафіку, під які попередня інфраструктура просто не була спроєктована», — розповіла TechCrunch Тіа Вайт, генеральна менеджерка Amazon OpenSearch Service. — «Вони сплескують без попередження, простоюють без оголошення, а підприємствам потрібен пошук, який встигає за ними, не змушуючи платити за порожні або неактивні обчислення».
Ключова технічна зміна в новому поколінні полягає в розділенні обчислень і сховища. Це дозволяє масштабувати обчислювальні ресурси за лічені секунди для обробки пікових агентних навантажень і зменшувати їх до нуля, щоб клієнти платили $0 у періоди, коли агенти неактивні.
«Раніше, навіть у нашій попередній серверлес-версії, потрібно було мати щонайменше один активний інстанс, оскільки сховище й обчислення були жорстко пов’язані, — пояснила Вайт. — Не можна було просто автоматично нарощувати [обчислення] з потрібною швидкістю, тож ви завжди тримали резерв обчислювальних потужностей для свого навантаження — незалежно від того, використовували їх чи ні».
Це можна порівняти з постійною оплатою паркувального місця, навіть коли ви ним не користуєтеся. З оновленим Serverless від AWS це радше схоже на оплату паркування за лічильником — платите лише за фактичний час використання.
На старті OpenSearch Serverless матиме нативні інтеграції з платформами для розробки ШІ, такими як Vercel і Kiro. Це дозволить розробникам розгортати готові до продакшну пошукові й векторні бекенди для агентів без необхідності керувати інфраструктурою.
Подібний зсув відбувається в усій хмарній індустрії. Databricks та Snowflake позиціонують себе як системи пам’яті та отримання даних для корпоративного ШІ. Microsoft випустила оновлення Azure, розроблені для обробки стрибкоподібних навантажень від ШІ-агентів та спільного використання пам’яті між ними. Cloudflare, подібно до Amazon, минулого місяця представила інфраструктуру, що надає агентам постійні середовища й миттєву масштабованість.
Чим більше компаній розгортатимуть ШІ-агенти, тим сильнішим буде тиск на перебудову інфраструктури під машинні навантаження. Це, у свою чергу, може зробити агентів дешевшими та простішими в розгортанні на великих масштабах.


