Математики-аматори почали використовувати чат-боти зі штучним інтелектом для розв’язання давніх математичних проблем, що стало несподіванкою для професійної спільноти. Хоча йдеться не про найскладніші задачі в математичному каноні, успіх моделей штучного інтелекту в роботі з ними, за словами дослідників, свідчить про подолання важливого порогу в математичних можливостях таких систем і потенційно може докорінно змінити спосіб, у який здійснюється математичне дослідження.
Питання, які нині розв’язуються за допомогою штучного інтелекту, походять від угорського математика Пола Ердеша, відомого здатністю формулювати корисні, але водночас надзвичайно складні задачі протягом кар’єри, що тривала понад шість десятиліть. За словами Томаса Блума з Манчестерського університету у Великій Британії, ці питання зазвичай були дуже простими за формулюванням, але надзвичайно важкими за змістом. Станом на момент смерті Ердеша у 1996 році існувало понад тисячу нерозв’язаних задач, що охоплювали широкий спектр математичних дисциплін, від комбінаторики, яка вивчає поєднання, до теорії чисел. Нині ці задачі розглядаються як орієнтири прогресу у відповідних галузях, зазначає Блум, який веде вебсайт з каталогізацією цих проблем і відстеженням поступу математиків у їх розв’язанні.
Оскільки задачі Ердеша часто є простими для формулювання, математики почали експериментувати з поданням їх до інструментів штучного інтелекту, зокрема до ChatGPT. За словами Блума, у жовтні минулого року він почав помічати, що люди використовують моделі штучного інтелекту для пошуку релевантних посилань у математичній літературі, які допомагали у побудові розв’язань.
Невдовзі після цього інструменти штучного інтелекту почали знаходити часткові покращення відомих результатів, деякі з яких уже з’являлися в попередніх наукових публікаціях, тоді як інші виглядали новими. Блум зазначає, що був здивований таким розвитком подій, оскільки раніше під час спроб використання ChatGPT система вигадувала неіснуючі статті, фактично галюцинуючи, через що від її застосування було відмовлено. Водночас приблизно з жовтня відбулися помітні зміни, і система почала знаходити справжні наукові праці, які вона, як виявилося, опрацювала повністю і часто в нетривіальний спосіб.
Натхненні цим прогресом, Кевін Баррето, студент бакалаврського рівня з математики Кембриджського університету, та Ліам Прайс, математик-аматор, почали шукати прості та малодосліджені задачі Ердеша, які можна було б спробувати розв’язати за допомогою штучного інтелекту. Після виявлення однієї з таких задач, під номером 728, що є гіпотезою з теорії чисел, її було подано на розв’язання моделі ChatGPT-5.2 Pro.
За словами Баррето, після ознайомлення з формулюванням виникло припущення, що ця задача може бути доступною для розв’язання за допомогою ChatGPT, і відповідна спроба була здійснена. У відповідь система надала аргументацію, яку багато фахівців визнали досить витонченою та концептуально складною. Після того як ChatGPT згенерував доведення, Баррето і Прайс скористалися іншим інструментом штучного інтелекту під назвою Aristotle, створеним компанією Harmonic. Цей інструмент перетворює традиційне текстове доведення на форму, записану мовою Lean, яка є мовою математичного програмування. Після цього результат може бути миттєво перевірений комп’ютером на коректність. За словами Блума, цей етап є надзвичайно важливим, оскільки дозволяє заощаджувати обмежений час дослідників, який зазвичай витрачається на перевірку правильності результатів.
Станом на середину січня шість задач Ердеша були повністю розв’язані за допомогою інструментів штучного інтелекту, однак подальший аналіз з боку професійних математиків показав, що п’ять із цих задач уже мали розв’язання в науковій літературі. Лише одна задача, під номером 205, була повністю розв’язана Баррето і Прайсом без будь-якого попереднього відомого розв’язання. Окрім цього, інструменти штучного інтелекту сприяли незначним покращенням і частковим розв’язанням ще семи задач, для яких не виявлено попередніх аналогів у літературі.
У зв’язку з цим триває дискусія щодо того, чи справді такі інструменти створюють нові ідеї, чи лише віднаходять старі й забуті розв’язання. Блум звертає увагу на те, що моделі штучного інтелекту часто змушені перекладати задачі в інші формальні форми і при цьому знаходять наукові роботи, у яких ім’я Ердеша взагалі не згадується. За його словами, значну частину таких публікацій він самостійно не зміг би знайти, і, ймовірно, вони залишалися б поза увагою значно довше без використання інструментів штучного інтелекту.
Іншим відкритим питанням залишається межа застосування такого підходу. Хоча всі ці задачі не належать до найскладніших у математиці і теоретично могли б бути розв’язані аспірантом першого року навчання, сам факт того, що штучний інтелект здатен виконувати подібну роботу, є вражаючим, зазначає Блум, оскільки для цього потрібні нетривіальні інтелектуальні зусилля. Після того як ChatGPT згенерував доведення, Баррето і Прайс знову скористалися інструментом Aristotle, створеним компанією Harmonic, який перетворює текстове доведення на формальний запис мовою Lean і дозволяє миттєво перевірити його коректність. Блум підкреслює, що це істотно зменшує навантаження на дослідників, які мають обмежений час для ручної перевірки результатів.
Станом на середину січня шість задач Ердеша були повністю розв’язані за допомогою інструментів штучного інтелекту, однак подальша перевірка професійними математиками показала, що п’ять із них уже були розв’язані раніше. Лише задача номер 205 була повністю розв’язана Баррето і Прайсом без наявності попереднього відомого розв’язання. Крім того, інструменти штучного інтелекту дозволили отримати часткові результати та невеликі покращення для ще семи задач, які, ймовірно, не мали аналогів у наявній науковій літературі.
У підсумку триває обговорення того, чи створюють ці інструменти справді нові математичні ідеї, чи лише ефективно витягують із масивів знань старі та маловідомі результати. Блум зазначає, що моделі штучного інтелекту часто змінюють форму подання задач і знаходять наукові роботи, які не містять жодних згадок про Ердеша, і що без такого інструментарію ці матеріали могли б залишатися непоміченими ще тривалий час.
Окремо постає питання масштабів застосування цього підходу. Хоча розглянуті задачі не є найвибагливішими в математиці і могли б бути виконані аспірантом початкового рівня, сам факт їх успішного розв’язання за допомогою штучного інтелекту залишається показовим. Блум підкреслює, що це вимагає значних інтелектуальних зусиль, і тому здатність систем штучного інтелекту виконувати таку роботу є суттєвим досягненням.
Математики часто змушені зосереджуватися на невеликій кількості надзвичайно складних проблем через обмеженість часу, тоді як багато менш складних, але все ж важливих задач залишаються поза увагою. За словами Терренса Тао, якщо інструменти штучного інтелекту можна буде застосовувати до великої кількості таких задач одночасно, це може призвести до більш емпіричного, майже науково-експериментального підходу до математики, у межах якого різні методи розв’язання можна буде тестувати в масштабі.
Тао зазначає, що спільнота надзвичайно обмежена в обсязі експертної уваги, через що близько дев’яноста дев’яти відсотків потенційно цікавих задач залишаються недослідженими. У результаті не проводяться систематичні огляди сотень проблем із метою знайти справді перспективні напрями або статистичні дослідження на кшталт порівняння ефективності різних методів. За його словами, такий тип математики фактично не практикується через брак інтелектуальних ресурсів, однак застосування штучного інтелекту демонструє, що масштабна математика в принципі можлива.
За матеріалами: New Scientist














