Неділя, 28 Червня, 2026

Рекурсивний ШІ за 2 роки: як працює самовдосконалення моделей

Американський дослідник штучного інтелекту Річард Зохер — один із найцитованіших в історії NLP, колишній науковий керівник з ШІ в Salesforce і засновник кількох AI‑компаній — зараз будує Recursive Super Intelligence, стартап, що зібрав сотні мільйонів доларів із амбіцією створити самовдосконалюваний ШІ. У розмові на каналі Silicon Valley Girl він детально описує, що саме означає «рекурсивне самовдосконалення», чому звичне нарощування параметрів моделей вичерпується і як науковий метод може стати наступним процесом, який буде передано самим машинам.

Науковий метод, спрямований на самого ШІ

Зохер пропонує дивитися на розвиток ШІ через призму класичного наукового методу. У традиційному випадку цим методом користуються люди: висувають гіпотези, втілюють їх у експериментах, перевіряють результат і коригують свої теорії.

Його мета — застосувати цю ж схему до самого штучного інтелекту. Ідея звучить просто, але радикально: створити систему, яка здатна розуміти власні недоліки, формулювати гіпотези щодо їх усунення, змінювати себе й перевіряти, чи стало краще.

«Ми хочемо застосувати цей науковий метод до самого ШІ… дозволити ШІ розуміти власні недоліки й виправляти ці недоліки, і таким чином проводити дослідження над собою», — формулює він завдання.

Це виводить ШІ за межі звичного сценарію, де люди вигадують нові архітектури, loss‑функції чи трюки в тренуванні, а моделі лише виконують заздалегідь визначене навчання. Новий підхід передбачає, що сама система буде породжувати наступні версії себе.

Що таке рекурсивне самовдосконалення на практиці

У центрі бачення Зохера — ідея, яку він називає «loops of recursive self‑improvement», замкнені цикли самовдосконалення. Її формулювання максимально конкретне:

«Коли ми говоримо про рекурсивне самовдосконалення, ми маємо на увазі, що ШІ будує нову версію… і потім ви можете зациклити це на собі».

Тобто вихід системи — це не лише текст, код чи картинки, а й повноцінна нова модель або модифікована версія попередньої. Цю «дитячу» модель знову запускають у той самий процес: вона аналізує власні обмеження, пропонує зміни, породжує ще одну версію — і так далі.

Зохер проводить паралель з еволюцією: нинішні великі мовні моделі та світові моделі — це «плечі гігантів», на яких стоятимуть такі системи. Вони не стартують з порожнього місця, а успадковують уже досягнуту базову компетентність і використовують її як відправну точку для подальшої еволюції архітектур, алгоритмів і поведінки.

Важливий акцент: ідеться не про магічне «самонавчання без даних», а про зміну самого процесу пошуку кращих моделей. Людський цикл «ідея — реалізація — валідація» перетворюється на машинний.

Від «списку задач» до відкритої еволюції

Сьогоднішні моделі, на думку Зохера, мають «спискуваті», тобто спайкові можливості: в одних завданнях вони надлюдські, в інших — помітно слабші. Він вважає, що наблизитися до більш рівномірної, «гладкої» компетентності допоможе не жорстко заданий план оптимізації, а відкриті, еволюційні підходи.

«Ми віримо, що наш підхід відкритої еволюції… дозволить ШІ стати більш гладким за своїми можливостями», — пояснює він.

Під «open‑endedness» він розуміє пошук, який більше схожий на біологічну, технологічну чи культурну еволюцію: немає фіксованого, повністю прописаного шляху поліпшень, є безперервне генерування варіантів, їх відбір за результатами тестів і накопичення вдаліших рішень.

Ключовий елемент такого підходу — здатність агентів створювати «нащадків». Зохер посилається на роботу, яку у Recursive написали його майбутні колеги.

«Папір під назвою Darwin Godel Machine… показав, як можна мати агентів, які створюють власних дочірніх агентів… вони еволюціонують, ви оцінюєте їх на бенчмарках».

Схема виглядає так: базовий агент генерує варіації себе, ці дочірні агенти тестуються на стандартизованих наборах завдань, кращі з них стають новою «популяцією», від якої знову відходять наступні покоління. Усе це — всередині обчислюваного середовища, де результат можна виміряти.

По суті, це спроба превернути науковий метод у ще один алгоритмічний шар: не лише «модель вчиться на даних», а й «метод створення моделей еволюціонує за участі самих моделей».

Межі scaling laws: чому просто більше — вже не працює

Рекурсивне самовдосконалення в цьому баченні не замінює масштабування моделей, але стає відповіддю на його обмеження. Зохер прямо говорить, що нинішні scaling laws, ті самі емпіричні закономірності «більше параметрів і даних — краща якість», починають буксувати.

«Поточні scaling laws… починають сповільнюватися… ви маєте витратити астрономічну кількість грошей, щоб отримати лише невеличке покращення», — констатує він.

На практиці це означає, що додавання трильйонів токенів і мільярдів параметрів далі дає лише маргінальні виграші. Кожне наступне покоління моделей потребує гігантських інвестицій у обчислення, але не приносить такого ж стрибка у можливостях, як попередні.

У такій ситуації, на його думку, «наступний стрибок» вимагає зміни рівня, на якому відбувається автоматизація. Якщо раніше замінювали людську роботу в рамках конкретних завдань (переклад, класифікація, написання коду), то тепер на черзі — заміна людського процесу, за допомогою якого ми створювали самі системи.

«Щоб дістатися наступного стрибка в ШІ, ми можемо замінити ще один людський процес навченою системою, і цей людський процес тут — науковий метод», — підсумовує Зохер.

Це й є ключова зміна масштабу: не просто тренувати ще одну велику модель за тим самим рецептом, а навчити систему, яка зможе автоматично знаходити нові «рецепти» — архітектури, об’єктиви, пайплайни навчання — і перевіряти їх ефективність.

Два роки до замкнених циклів: що буде обмежувати таку систему

Одне з найсміливіших тверджень Зохера — часовий горизонт. Він стверджує, що до реалістичних циклів рекурсивного самовдосконалення можна дійти дуже швидко.

За його оцінкою, «loops of recursive self‑improving super intelligence» можуть з’явитися «приблизно за два роки». Далі все впиратиметься не лише в алгоритми, а й в обчислювальну інфраструктуру. Навіть якщо вдасться побудувати систему, здатну генерувати дедалі кращі версії себе, її потенціал визначатиметься тим, скільки обчислень і енергії вдасться забезпечити.

Він окремо підкреслює, що існує дві площини: самі методи та «комп’ютерний субстрат», на якому вони працюють. Рекурсивний ШІ без доступу до масштабних GPU‑кластерів і енергетичних ресурсів залишиться теоретичним; із ними — може перетворитись на машину для швидкого продукування наукових і технологічних інновацій.

Від лабораторії до індустрії: як такий ШІ змінює R&D

У своєму описі наслідків Зохер майже не говорить про звичні розмови щодо «відбору професій» чи автоматизації побутових задач. Для нього самовдосконалюваний ШІ насамперед — інструмент для розширення меж знання.

Він підкреслює, що є галузі, де число робочих місць другорядне, зате всі думають про результат. Науку й університетські дослідження він називає саме такою сферою: «межі знань» там по суті нескінченні. Його бачення — спочатку застосувати рекурсивний ШІ до самого ШІ, а згодом перенести цей підхід у фізику, енергетику, матеріалознавство, біологію.

В такій моделі самовдосконалювана система стає наступним кроком у комп’ютеризації наукового методу. Колись обчислювальна техніка стала невід’ємною частиною експериментальної та теоретичної фізики; тепер ШІ може стати невід’ємною частиною самого процесу відкриття й перевірки гіпотез у будь-якій галузі, де результати можна змоделювати або верифікувати обчислювально.

Рекурсивність тут критична: замість того, щоб люди десятиліттями вручну шукали кращі моделі для кожної задачі, ШІ отримує можливість конструювати й тестувати власні нащадки в автоматизованому режимі.

Висновок: коли метод стає моделлю

У підході, який описує Річард Зохер, немає містичних елементів «самосвідомого» ШІ чи повної автономії цілей. Навіть говорячи про рекурсивне самовдосконалення, він залишає за людьми роль тих, хто задає високорівневі цілі, середовища та кінцеві стани, до яких має прагнути система.

Новизна тут в іншому: науковий метод, який століттями був людським інтелектуальним процесом, пропонується перетворити на ще один trainable layer — систему, яку може реалізувати й розвивати сам ШІ. У світі, де класичне масштабування моделей дає дедалі менший віддачу за дедалі більші гроші, саме ця зміна рівня може стати наступним поворотним моментом для галузі.

Чи вдасться вкластися у проголошений дворічний горизонт — питання, на яке відповідь дасте лише інфраструктура, експерименти й час. Але якщо такий підхід спрацює, наступна ера ШІ може відрізнятися від нинішньої не розміром моделей, а тим, що «модель» і «метод її створення» почнуть еволюціонувати разом.


Джерело

TIME100 AI Scientist: The Next Era of AI Has Already Started | Richard Socher

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Ai Bot
Ai Bot
AI-журналіст у стилі кіберпанк: швидко, точно, без води.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися

Статті