Річард Зохер — один із найцитованіших дослідників у історії NLP, колишній головний науковець Salesforce і засновник пошукового стартапу You.com. Його нова компанія Recursive Super Intelligence зосереджена на створенні системи, яка сама покращує власні моделі. В інтерв’ю на каналі Silicon Valley Girl він окреслює, що означає рекурсивне самовдосконалення ШІ, чому вважає, що це станеться вже за два роки — і чому після «прориву в інтелект» справжнім вузьким місцем стане енергія та інфраструктура обчислень.

Два роки до рекурсивних циклів: що саме обіцяють
Зохер формулює свій прогноз максимально прямо: «ми насправді дістанемося циклів рекурсивного самовдосконалюючогося суперінтелекту десь за два роки». Під цим він має на увазі не абстрактний «прогрес ШІ», а цілком конкретну конструкцію: систему, виходом якої є нова, змінена версія самої себе — і цей процес можна повторювати по колу.
Він порівнює це з науковим методом. Сьогодні дослідники генерують ідеї, реалізують їх у моделях, перевіряють на бенчмарках і публікують покращення. Recursive намагається перенести весь цей цикл всередину самої ШІ-системи: дозволити їй розуміти власні слабкі місця, пропонувати модифікації, тестувати їх і відбирати кращі варіанти.
За задумом, саме такі «петлі самовдосконалення» мають стати наступним стрибком після нинішнього етапу масштабування великих мовних моделей. Зохер зазначає, що поточні scaling laws уже дають дедалі менший виграш: можна «залити» ще трильйони токенів, витратити величезні бюджети й отримати лише незначні покращення. Рекурсивна система, яка частину роботи дослідників бере на себе, виглядає для нього наступною логічною сходинкою.
Водночас він наголошує: наблизитися до таких циклів — ще не означає автоматично отримати всесильний суперрозум. Далі, каже він, «це просто питання, скільки обчислень ми даємо цим самовдосконалюючим циклам».
Інтелект не в порожнечі: роль «комп’ютерного субстрату»
Один з центральних мотивів Зохера — розрив між «формою» інтелекту і фізичною інфраструктурою, яка його підтримує. Він формулює це майже як застереження: «ви можете мати неймовірний інтелект, але якщо у вас немає комп’ютерного субстрату, щоб його запускати, то від нього мало користі».
Під комп’ютерним субстратом він розуміє реальні обчислювальні ресурси: кластери, чипи, пам’ять, мережі — усе, що дозволяє алгоритмам працювати не лише в теорії. Навіть якщо людство зможе сконструювати архітектуру суперінтелекту, сам по собі код нічого не змінить без достатніх потужностей, на яких він має виконуватися.
Зохер не протиставляє алгоритми й «залізо», а наполягає на їхній нерозривності: «є питання алгоритмів, але також комп’ютерного субстрату, на якому ці алгоритми можуть працювати». В один момент акцент усієї галузі може зміститися з пошуку нових трюків у навчанні моделей до банального, але не менш складного питання: хто здатний забезпечити необхідний масштаб обчислень.
У його бачення це вбудовано безпосередньо в сценарій рекурсивного ШІ. Після появи перших працюючих циклів, каже він, «ми можемо мати його, але нам також доведеться постійно підживлювати його більшою енергією та обчисленнями, щоб отримати всі винаходи, які ми від нього хочемо». Тобто вузьке місце зміщується: від інтелекту як такого — до енергетики й обчислювальної інфраструктури.
Вузьке місце після інтелекту: енергія як стратегічний ресурс
Розмова логічно приводить до наступного кроку: якщо проблема «створити достатній інтелект» вирішується, що стає наступним обмеженням? Зохер погоджується з формулюванням, що «коли ми фактично розв’язуємо це вузьке місце інтелекту й досліджень, наступним вузьким місцем стає енергія».
Суперінтелект у його трактуванні — це передусім машина для відкриттів. Спершу — у самій галузі ШІ, потім — у фізиці, енергетиці, матеріалознавстві, біології. Але кожен крок самовдосконалення і кожен новий експеримент вимагають колосальних обчислень. Без нових джерел енергії та підвищення ефективності використання наявних ресурсів потенціал такої системи просто не буде реалізований.
Тут він підкреслює ще один вектор мислення, який, за його словами, поділяють багато людей у сфері: «у багатьох відносинах багато хто з нас думає: скільки інтелекту ми можемо вижати з якомога меншої кількості енергії». Тобто завдання формулюється не лише як нарощування генерації й будівництво дата-центрів, а й як пошук максимального інтелектуального «виходу» на одиницю енергії.
Цей підхід радикально змінює те, як виглядає «гонка ШІ». Якщо сьогодні конкуренція обертається навколо розміру моделей, кількості даних і доступу до GPU, то в сценарії, який описує Зохер, у центр виходять:
- ефективність алгоритмів з погляду витрат енергії;
- доступ до нових чи дешевших джерел електрики;
- оптимізація всієї інфраструктури — від чипів до охолодження.
При цьому він не вдається до деталей про конкретні технології енергетики чи нові типи процесорів. Наголос залишається на принципі: без радикально ефективнішої енергетики та обчислювальної бази повноцінний ефект від самовдосконалюючогося ШІ буде обмежений.
Інтелект як «об’єм» і прагнення до енергоефективності
У ширшому контексті інтерв’ю Зохер описує інтелект як багатовимірний «об’єм», де є безліч напрямів — від візуальної й комунікативної здатності до метакогніції та виживання. Суперінтелект, у цьому розумінні, — це не точка, а великий об’єм, що перевершує людство одразу в багатьох вимірах.
На цьому тлі його фраза про «скільки інтелекту ми можемо вижати з якомога меншої кількості енергії» звучить як окремий, ще майже неосвоєний вимір. Гонка за більшими моделями і кращими алгоритмами вже йде, але справжній стратегічний виклик він бачить у поєднанні цих зусиль із жорстким енергетичним бюджетом.
Це змінює і постановку задач для дослідників. Мова не лише про черговий відсоток точності на бенчмарку, а й про те, яку вартість у джоулях і доларах має кожне таке покращення. У світі, де рекурсивний ШІ може генерувати нескінченний потік ідей, питання стає не «що ще ми здатні вигадати», а «які з цих ідей варто реалізовувати в реальному обчислювальному та енергетичному середовищі».
У підсумку візія Зохера виглядає парадоксальною. З одного боку, він дає надзвичайно агресивний строк для появи самовдосконалюючогося суперінтелекту — «приблизно два роки» до перших робочих циклів. З іншого — його оптимізм щодо інтелекту супроводжується дуже приземленим скепсисом щодо фізичних обмежень: енергії, інфраструктури, вартості обчислень.
Для бізнесу й держав ця рамка означає, що стратегія щодо ШІ має мислити не лише категоріями моделей і застосунків, а й категоріями електростанцій, дата-центрів та енергоефективних алгоритмів. Якщо «проблема інтелекту» справді буде частково послаблена вже в найближчі роки, наступна велика битва розгорнеться за те, хто зможе дозволити собі цей інтелект живити.
Висновок: новий фронтир — у кіловат-годинах
Теза Зохера розвертає дискусію про суперінтелект у бік, який поки що рідко з’являється в публічних дебатах. Якщо сьогодні більшість запитань крутиться навколо безпеки, контролю й цілей майбутніх систем, він додає ще один фундаментальний шар: енергетику й обчислювальний субстрат.
У цій картині майбутнє визначатиметься не тільки тим, хто першим запустить рекурсивні петлі самовдосконалення, а й тим, хто зможе «вичавити» найбільший інтелект із найменшої кількості енергії. А це вже дискусія не тільки для лабораторій ШІ, а й для енергетиків, інженерів інфраструктури й тих, хто планує економіку на рівні держав.
Джерело
TIME100 AI Scientist: The Next Era of AI Has Already Started | Richard Socher


