Керівник ChatGPT і Codex в OpenAI Тібо Сотіо (Thibault Sottiaux) відповідає за продукти, які фактично стали стандартом для сучасних генеративних моделей. У розмові на каналі Silicon Valley Girl він описує не черговий «чат‑бот», а новий шар інфраструктури — агентів, що працюють з десятками інструментів, підключаються до реальних робочих середовищ і контролюються окремими системами безпеки. Цей стек, за його оцінкою, вже достатньо зрілий, щоб вийти за межі експериментів технічних ентузіастів і стати базою для повсякденної роботи мільйонів людей.

Йдеться не лише про зручніші підказки в чаті. OpenAI вибудовує екосистему з понад сотні плагінів, режимів «computer use» і «browser use», а також нової функції Auto Review, яка додає другий агент для перевірки дій основного. Разом це перетворює LLM‑моделі на керований, багатоступеневий механізм, здатний автономно працювати з чутливими даними, документами, поштою й кодом — і при цьому залишатися в межах прийнятного ризику.
Від чат‑бота до стеку інструментів: як агенти навчилися працювати «на довгу дистанцію»
Ключова зміна, яку описує Сотіо, стосується не стільки людей, скільки самої технології. Якщо раніше користувач мав «вигадувати промпти» й постійно втручатися, то тепер агенти GPT‑4.5‑класу стали достатньо надійними, щоб виконувати довгі ланцюжки дій з великою кількістю інструментів.
OpenAI за останній цикл розвитку додала до агентної системи понад 100 різних плагінів. Вони працюють разом із режимами computer use та browser use, дозволяючи моделі не просто «відповідати текстом», а взаємодіяти з реальним цифровим середовищем користувача. Агент може відкривати браузер, переходити за посиланнями, працювати з формами, запускати програми, взаємодіяти з файлами й сервісами — і все це в рамках одного безперервного робочого процесу.
За словами Сотіо, саме надійність у використанні багатьох інструментів «на довгому горизонті» стала переломним моментом. Раніше через помилки вже за кілька хвилин роботи користувачеві доводилося «лізти в конфігурацію», розбиратися з налаштуваннями, перезапускати сценарії. Це вимагало технічної підготовки й обмежувало аудиторію до розробників та просунутих користувачів. Тепер агент може стабільно виконувати складні сценарії без постійного ручного супроводу, і це відкриває двері для масового використання.
У практичному вимірі це означає, що для багатьох задач, які раніше вимагали окремих скриптів, cron‑завдань чи спеціальних сервісів, тепер достатньо «попросити агента». Наприклад, налаштувати регулярне дослідження ринку раз на 12 годин, автоматичне підбиття підсумків вхідних листів чи обробку списку лідів — усе це можна описати природною мовою, а агент сам використає потрібні інструменти й плагіни.
Цей перехід від «ручного промптингу» до стійких агентних робочих процесів і є тим, що Сотіо називає зрілістю технології. Вона більше не виглядає як лабораторний експеримент, а починає функціонувати як інфраструктура, на яку можна спиратися в повсякденній роботі.
Auto Review: другий агент як запобіжник для автономії
Чим більше повноважень отримує агент, тим гострішим стає питання безпеки. Якщо модель має доступ до пошти, документів, календаря й може самостійно надсилати листи або змінювати файли, помилка чи небажана поведінка перетворюються з дрібної неточності на реальний ризик.
Відповіддю OpenAI на це стала функція Auto Review, яку компанія нещодавно вивела у продакшн. Її суть — у створенні двоагентного контуру: основний агент виконує дії, а другий, окремий агент перевіряє кожен крок на предмет безпеки й прийнятності.
Цей другий агент аналізує, чи не робить система нічого, що може зашкодити користувачу, і чи залишаються дії в зоні низького ризику. Наприклад, він має запобігти ситуаціям, коли агент випадково надсилає електронний лист сторонній людині з особистими даними користувача або вносить небажані зміни в чутливі документи.
Важливий нюанс: Auto Review — це не побічний продукт розробки основної моделі, а результат роботи команд із безпеки та узгодження (safety та alignment). Сотіо підкреслює, що концепція виросла з досліджень саме цих підрозділів. Це показує, що OpenAI розглядає автономних агентів не як «фічу поверх моделі», а як систему, де безпека закладається на рівні архітектури.
Практичний ефект Auto Review полягає в тому, що агенти можуть працювати значно довше й автономніше, зокрема з чутливими даними. Якщо раніше користувач змушений був постійно «тримати руку на пульсі» й перевіряти кожну дію, то тепер частину цієї функції бере на себе другий агент. Це не скасовує людської відповідальності, але знижує ризик помилок у рутинних операціях і робить тривалі безперервні сесії реалістичними.
Саме завдяки таким запобіжникам стають можливими сценарії на кшталт нічної роботи агента, який обробляє пошту, готує зведення, оновлює документи, а вранці показує користувачу «дашборд» із результатами й запитами на підтвердження. Технологія для цього, за словами Сотіо, вже існує — питання лише в тому, як її упакувати в зрозумілий продукт.
Агенти в реальному робочому середовищі: від локальних файлів до Codex у хмарі
Щоб агенти були корисними, їм потрібен доступ до даних. І тут OpenAI рухається в бік глибшої інтеграції з реальними робочими середовищами користувачів, виходячи за межі локальних файлів.
Сотіо описує власну поточну практику як проміжний етап: він організовує проєкти у вигляді папок на локальному комп’ютері, тримає там нотатки, підтримує відносний порядок і використовує агента, щоб допомагати в організації. Кожен проєкт має свою структуру, набір файлів, нотаток і контекстів.
Однак така модель погано масштабується на сучасну реальність, де люди працюють із кількома пристроями — ноутбуком, стаціонарним комп’ютером у студії, ще одним в офісі, смартфоном у дорозі. Локальний агент на одному пристрої не «знає» того, що зберігається на іншому, і фактично перетворюється на окрему сутність із власною пам’яттю. Це створює фрагментацію й когнітивне навантаження: користувачеві доводиться пам’ятати, «який агент що знає».
За оцінкою Сотіо, протягом приблизно трьох місяців ця картина суттєво зміниться: пам’ять агентів і робочі файли почнуть системно переїжджати в хмару. Це означає, що агент матиме єдину, централізовану пам’ять, незалежно від того, з якого пристрою до нього звертаються. Він зможе самостійно керувати власною пам’яттю, допомагати користувачу впорядковувати файли, які зберігаються не на конкретному ноутбуці, а в загальному хмарному просторі.
Паралельно OpenAI розширює можливості Codex — інструмента, який у цьому контексті виступає не лише як «кодер», а як місток до продуктивних застосунків. Codex може безпосередньо отримувати інформацію з уже існуючих сервісів: електронної пошти, календаря, документів. Це важливий зсув: агент більше не обмежений тим, що лежить у локальній папці чи спеціально підключеній директорії в Google Drive. Він може працювати поверх реального робочого середовища користувача — того самого, де вже живуть листи, зустрічі, файли, нотатки.
У результаті з’являється можливість будувати агентні сценарії, які не вимагають від користувача «мігрувати» в нову систему. Замість створення ще одного застосунку для управління завданнями чи контентом, агент просто підключається до наявних інструментів і починає виконувати роботу там, де вона вже відбувається.
Дані для агента: тон голосу, стратегія й структура проєктів
Щоб агент працював не як абстрактний помічник, а як персоналізований інструмент, йому потрібен контекст про користувача. Сотіо пропонує кілька практичних підходів до того, як організувати ці дані.
Один із ключових елементів — тон голосу. Багато користувачів намагаються описати його текстом: «я пишу дружньо, але професійно», «я уникаю жаргону», «я люблю метафори». Сотіо радить іншу стратегію: замість декларацій краще надати приклади. Це можуть бути попередні розсилки, пости, уривки записів, повідомлення в різних контекстах — від професійних до особистих. Модель значно краще вчиться на реальних зразках, ніж на вербальних описах стилю.
Другий важливий блок — стратегічний контекст. Якщо агент має допомагати з контентом, маркетингом чи проєктним менеджментом, йому потрібне уявлення про загальну стратегію, цілі, пріоритети. Сотіо згадує, що сам тримає багато нотаток по проєктах, організованих у папки, де кожен проєкт має власний набір файлів. Така структура дозволяє агентові «розуміти», до якого контексту належить конкретне завдання, і працювати не з хаотичним набором документів, а з логічно впорядкованими блоками.
Третій компонент — контакти й зв’язки. Їх не обов’язково зберігати у вигляді статичних файлів: агент може отримувати інформацію з уже наявних застосунків — пошти, календаря, CRM чи інших систем. Тут знову ж таки вступає в гру Codex, який уміє «витягувати» потрібні дані з цих джерел.
У підсумку формується гібридна модель: частина даних живе у вигляді структурованих файлів (папки проєктів, нотатки, приклади тону голосу), інша — у продуктивних застосунках, до яких агент має доступ. Разом це створює достатньо багатий контекст, щоб агент міг не просто виконувати інструкції, а працювати в руслі стилю, стратегії й пріоритетів конкретної людини.
Від інбоксу до коду: автономія, відповідальність і майбутня підтримуваність
Один із найпомітніших наслідків зрілості агентів — поява сценарію «особистого асистента на комп’ютері». Сотіо очікує, що з часом це стане нормою: у кожного користувача буде власний агент, який займається рутинними, але критичними задачами — від податкових розрахунків і налаштування фільтрів у пошті до підтримки зв’язку з близькими.
Водночас він наголошує на важливому обмеженні: попри зростання автономії, відповідальність залишається на людині. Це особливо помітно в контексті коду. Якщо агент згенерував фрагмент програмного забезпечення, а той зламався або спричинив збій, відповідальність лежить не на моделі, а на розробнику, який цей код прийняв і впровадив. Те саме стосується код‑рев’ю: неможливо повністю «аутсорсити» розуміння системи агенту.
Ця позиція задає рамку для всього стеку агентів OpenAI: це інструменти для розширення можливостей людини, а не заміна людського розуміння. Агенти можуть знімати рутину, прискорювати роботу, виконувати довгі й нудні ланцюжки дій, але фінальне розуміння системи й прийняття рішень залишаються за людиною.
При цьому Сотіо дивиться на найближчі 6–9 місяців як на період суттєвого прогресу в одній із найболючіших тем — довгостроковій підтримуваності коду, написаного ШІ. Сьогодні багато команд уже активно використовують генеративні моделі для написання коду (Google, наприклад, повідомляє, що близько 75% їхнього коду створюється за участі ШІ), але питання підтримки, рефакторингу й узгодженості залишається складним.
Сотіо очікує, що саме завдяки кращим інструментам і агентним можливостям — зокрема навколо рефакторингу й забезпечення консистентності — ситуація помітно покращиться. Агенти зможуть не лише генерувати нові фрагменти, а й системно працювати з існуючою кодовою базою, підтримуючи її структуру, стилістику й архітектурні принципи на довгій дистанції. Це важливо не тільки для розробників: стабільніші, краще підтримувані системи — це менше збоїв і більше передбачуваності для всіх, хто працює поверх цих інструментів.
Водночас Сотіо застерігає від спокуси «віддати агентам усе й одразу». Використання агентів «для всього» на занадто ранньому етапі кривої можливостей може призвести до ненадійних результатів. З одного боку, це природна частина експериментів: ті, хто «штовхає межі», допомагають виявляти, де технологія вже стабільна, а де ще потребує доробки. З іншого — це нагадування, що навіть із Auto Review і розвиненим стеком інструментів агенти залишаються інструментом, а не магією.
Новий базовий шар роботи
Якщо дивитися на описану Сотіо картину цілісно, вимальовується новий базовий шар цифрової інфраструктури. На нижньому рівні — великі мовні моделі GPT‑класу. Над ними — стек інструментів: computer use, browser use, сотні плагінів, інтеграції з поштою, календарем, документами. Ще вище — агентні системи, здатні будувати довгі робочі процеси, керувати пам’яттю, працювати з хмарними даними. Паралельно — контур безпеки у вигляді Auto Review та інших механізмів, що дозволяють цим агентам діяти автономно, але в контрольованих межах.
Для користувача це може виглядати як «особистий асистент, який живе на моєму комп’ютері й у хмарі», але під капотом працює складна багаторівнева система. Вона вже сьогодні дозволяє автоматизувати рутинні задачі, інтегруватися з реальними робочими середовищами й поступово брати на себе все більшу частину операційної роботи — від інбоксу до коду.
Наскільки швидко цей шар стане таким же звичним, як електронна пошта чи календар, залежить не лише від OpenAI, а й від того, як ринок, регулятори й самі користувачі відреагують на поєднання автономії та відповідальності. Але технічні контури вже окреслені: зрілі агенти, багатий стек інструментів, хмарна пам’ять і двоагентний контроль безпеки. Це не футурологія, а інфраструктура, яка вже починає працювати.
Джерело
Head of ChatGPT & Codex: agents for normal people are HERE — Silicon Valley Girl


