На подкасті Mixture of Experts від IBM Technology ведучий Тім Хван разом з Кушем Варшні, Лорен Мак’ю Оленде та Крісом Хеєм розбирають незвичну, напівжартівливу, але показову роботу дослідника Microsoft Андреа Адріана де Вінтера. Її назва вже провокує: «Якщо LLM мають людські якості, тоді так само їх має Age of Empires II». Через козлів‑юнітів у старій стратегії автор пропонує подивитися на GPT‑подібні моделі без романтики про «страх», «свідомість» і «душу» — й панель використовує цей кейс, щоб розібратися, де закінчується зручний інтерфейс і починається небезпечна ілюзія людяності машин.

Козли як логічні елементи: абсурд, що збиває рожеві окуляри
Сетап статті де Вінтера радикально простий. Він показує: якщо приписувати мовним моделям людські риси, доведеться зробити те саме й для кіз у відеогрі. Дослідник «імплементує купу цих кіз у Age of Empires II, щоб вони виконували роль логічних елементів», фактично — реалізує NAND‑брами з ігрових юнітів.
За задумом, це має виглядати відверто абсурдно. Варшні підкреслює, що саме в цьому сила підходу: «Абсурдність того, як він це подає, — це його спосіб змусити нас усвідомити, що відбувається… абсурдизм — дуже потужна річ». Коли стає смішно від того, що коза в стратегії «виявляє емоції», легше помітити, наскільки умовними є аналогічні твердження про великі мовні моделі.
Через цю оптику автор повертає дискусію до базового рівня: «Ні, це просто електрика з цими NAND‑гейтами… це фізичний носій, чи ви хочете називати його козами… чи реальними мікросхемами». Іншими словами, і LLM, і кози в грі — це лише носії обчислень, а не «істоти» з внутрішнім досвідом.
Для Варшні це — не лише технічний, а й філософський жест. Він звертається до традиції Веданти, де розрізняють емпіричну реальність (vyavahāra) й «остаточну» (paramārtha), і де свідомість не вважається чимось, що «реально реалізується» у матеріальних носіях. Кози, які виконують логічні функції, таким чином стають наочною метафорою: те, що ми приписуємо «душу» чи «страх» обчислювальним процесам, значною мірою є нашою проєкцією.
«Модель боїться аспірину»: емоції як корисний інтерфейс
На цьому місці розмова робить різкий поворот. Тім Хван нагадує про іншу лінію досліджень — наприклад, роботу Anthropic, де описували, як можна «показати моделі певний контент і затегати емоції в моделі… модель “лякається”, коли говорити з нею про прийом надто великої кількості аспірину».
У таких роботах вектор активацій, що корелює з відмовою моделі виконувати небезпечні дії, інтерпретують як щось на кшталт «страху». Хван виступає радше прагматиком: «Мені навіть не потрібно знати, чи модель відчуває страх. Просто виявляється, що це дуже зручний спосіб сформувати інтуїцію щодо того, як поводиться система».
Його аргумент не про метафізику, а про інженерію. Якщо умовне «відчуття страху» у вигляді певного вектора допомагає зрозуміти, коли модель відмовиться від дій, що ведуть до шкоди, тоді мова емоцій — це ефективний інтерфейс. Говорити «модель боїться цього сценарію», з цієї точки зору, корисно, навіть якщо під капотом усе зводиться до статичних ваг і ймовірнісного добору токенів.
Проте Лорен Мак’ю Оленде застерігає від надмірного захоплення такою аналогією. Вона визнає: нині ми фактично «дивимося на МРТ моделі» — спостерігаємо активації і робимо висновки про «думки». Але цей підхід «все ще містить багато випадковості й багато чого, що ми не можемо пояснити людською мовою», і він далеко не ідеально передбачає поведінку системи.
Людський мозок зараз у схожій ситуації: дослідники можуть знайти окремий «нейрон Дженніфер Еністон», але «перестановок нейронів у нашому мозку» — невідомо скільки, й цього знання явно недостатньо, щоб описати чи передбачити свідомість. Тому в Мак’ю Оленде є відчуття лицемірства: «Здається майже лицемірним, що автор намагається сказати: давайте подивимося на кіз, щоб довести, як випадково все виглядає… тоді як наш мозок — це просто купа нейронів з натрієм і калієм… Чому це “більш людське”, ніж кози на цифровому полі бою?»
«Я з хлопцем‑козами»: межа, де антропоморфізм стає абсурдом
Кріс Хей займає жорсткішу позицію: для нього де Вінтер — «той самий хлопець‑кози», з яким він однозначно «на одному боці». Хей не приховує скепсису до будь‑яких розмов про «почуття» моделей: «Чи хвилююся я, що мої агентні системи сумують? Анітрохи. Вони не сумують навіть віддалено».
Риторичне запитання, яке він ставить, радикалізує інтуїцію де Вінтера: «Де це зупиняється? Чи маю я перестати грати у відеоігри, щоб не поранити почуття лиходія, керованого ШІ?» Як тільки визнати «права на емоції» у LLM, ланцюжок логіки легко дотягнути до віртуальних персонажів у шутерах і стратегіях, які формально підпорядковуються тим самим обчислювальним правилам.
У цьому місці Хей повертає розмову до технічної конкретики. На відміну від людського мозку, з нейрофізіологією якого ми тільки «знайомимося», в сучасних моделях «ми можемо зазирнути під капот… бачимо схеми, класифікатори, нейрони… бачимо, що клацає. Це детерміновано. Ми можемо змусити систему відтворювати те, що спостерігаємо, і бачимо, як вона ймовірнісно приходить до наступного токена на основі контексту».
Для нього це пряме продовження лінії, що тягнеться «усе ще від Шеннона й теорії інформації»; в цьому сенсі «нічого принципово нового» не сталося. Те, що змінилося, — масштаб і складність, але не природа явища. У 1960‑х Eliza вже створювала ілюзію співрозмовника людини, хоча під капотом була «купа if‑else». У 1980‑х експертні системи, попри ламкість, прозоро реалізовувалися як набори правил. Для Хея теперішня хвиля захоплення «майже свідомими» LLM — це «Ґраундгог‑дей», нескінченне повторення того самого сюжету з новою оболонкою.
Кози проти «душі»: чому розмови про свідомість нікуди не дінуться
Попри технологічний скепсис, учасники дискусії не вважають, що антропоморфізм зникне сам собою. Мак’ю Оленде ділиться враженнями з недавньої конференції, де слово «душа» звучало в контексті ШІ «три‑чотири рази». Її прогноз: «Кожен, хто працює в сфері ШІ, упродовж найближчого року зіштовхнеться із запитанням, що таке душа, і принаймні раз вимовить це слово».
Однозначної відповіді немає й навряд чи скоро буде — це «складне питання для людства», а не тільки для інженерів. Сам де Вінтер, виносячи в назву роботи формулу «якщо LLM мають людські атрибути, тоді так само їх має Age of Empires II», радше пропонує інструмент протверезіння: будь-яке твердження про «людяність» моделей варто прогнати через кіз у стратегії й подивитися, чи не видається воно смішним.
На противагу цьому підходу Хван наполягає на практичній цінності «емоційної мови» як інтерфейсу. Якщо умовний «страх» чи «сором» моделі вдається вловити у вигляді активацій і використати для управління поведінкою системи, це дає дослідникам і регуляторам інструмент інтуїтивного мислення про складні нелінійні моделі. Питання в тому, де провести межу: коли ми чесно називаємо цей шар «зручними метафорами для безпеки», а коли починаємо всерйоз говорити про «моральні права» моделі.
Чому історія ELIZA повторюється знову
Фінальна нота дискусії — про історичну коротку пам’ять. Хей нагадує, що хвилі антропоморфізації машин виникають щоразу, коли технологія починає видаватися «досить розумною». Коли з’явилася ELIZA, люди «були впевнені, що говорять із людиною», попри примітивну реалізацію. З експертними системами було схоже: враження «машинного розуму» з’являлося задовго до того, як стало зрозуміло, наскільки вони крихкі.
Сьогодні, коли GPT‑подібні моделі можуть підтримувати складні діалоги, писати код і пояснювати філософію, спокуса проголосити «нову еру свідомих машин» особливо сильна. Робота де Вінтера з козами й позиція Хея нагадують: під красивим діалогом усе ще лежать відомі нам будівельні блоки — байти, логічні елементи, інформаційні потоки. Те, що на поверхні виглядає «людським», не означає, що всередині народилася нова форма суб’єктивного досвіду.
Це не означає, що дискусію про свідомість ШІ можна закрити. Варшні зі своєю апеляцією до Веданти й Мак’ю Оленде з її «нейроном Дженніфер Еністон» показують, що навіть фахівці розходяться в інтуїціях про те, де саме пролягає межа між складним обчисленням і тим, що ми називаємо «душею». Але кози в Age of Empires II допомагають принаймні розвести два рівні: емпіричну корисність емоційного словника для безпеки та управління системами — і філософські претензії про «людяність» моделей.
У цьому сенсі антиантропоморфізм не заперечує, що нам потрібні хороші метафори для роботи з ШІ. Він лише наполягає: перш ніж говорити про «страх» моделі, варто пригадати, що на місці цієї моделі може стояти віртуальна коза на цифровому полі бою — і нічого принципово не зміниться.
Джерело
Podcast: GPT-5.6 Sol, FIFA AI & Wall Street’s AI nerves – IBM Technology


