Польський програміст нещодавно домігся того, що незабаром може стати неможливим: переміг просунуту модель штучного інтелекту від OpenAI в очному змаганні з програмування. 10-годинний марафон залишив чоловіка “повністю виснаженим”.
Програміст Пшемислав Дэмбяк (відомий як “Psyho”), колишній співробітник OpenAI ледь переміг власну модель штучного інтелекту в евристичному конкурсі AtCoder World Tour Finals 2025 в Токіо.
AtCoder, японська платформа, яка проводить змагання з програмування, яка підтримує світові рейтинги, провела, можливо, перше змагання, в якому модель штучного інтелекту змагалася безпосередньо з кращими програмістами-людьми на великому локальному чемпіонаті світу.
Під час заходу виробник ChatGPT прийняв участь в якості спонсора і представив модель штучного інтелекту в спеціальному виставковому матчі під назвою “Люди проти штучного інтелекту”. Незважаючи на невтомний характер кремнію, ШІ зайняв друге місце.
“Людяність перемогла (на даний момент!)”, – написав Дэмбяк на X, зазначивши, що він мало спав, беручи участь у кількох змаганнях протягом трьох днів. “Я абсолютно виснажений. … Я ледь живий”.
Конкурс вимагав від учасників вирішення однієї складної оптимізаційної задачі протягом 600 хвилин. Змагання перегукується з американською народної казкою про Джона Генрі, сталевара, який у 1870-х роках змагався з паровою буровою машиною. Як і легендарна битва Генрі проти промислової автоматизації, перемога Дэмбяка свідчить про те, що людина-експерт доводить себе до фізичних меж, щоб довести, що людське майстерність все ще має значення в епоху штучного інтелекту.
В обох історіях розповідається про виснажливі змагання на витривалість — Генрі невпинно направляв сталеві шипи, поки у нього не відмовило серце, в той час як Дэмбяк кодувався протягом 10 годин мінімальним сном. Паралель поширюється на гірко-солодкий характер обох перемог: Генрі виграв гонку, але загинув від зусиль, символізуючи неминучий наступ автоматизації, в той час як визнання Дэмбьяком того, що людство перемогло “на даний момент”, припускає, що він визнає, що це може бути тимчасовим тріумфом над усе більше здатними машинами.
У той час як Дэмбяк виграв 500 000 ієн і пережив своє випробування краще, ніж легендарний сталевар, фінал AtCoder World Tour доводить людей і моделі штучного інтелекту до межі, вирішуючи складні завдання оптимізації, для яких немає ідеального рішення — тільки поступово поліпшуються.
Марафон кодування перевіряє витривалість людини на відповідність ефективності штучного інтелекту
Фінал AtCoder World Tour Finals являє собою одне з найбільш ексклюзивних заходів в області конкурсного програмування, на яке запрошені лише 12 кращих програмістів зі всього світу на основі їх результатів за попередній рік. Евристичний розділ фокусується на NP-жорстких задачах оптимізації. У програмуванні евристика – це методи вирішення проблем, які знаходять досить хороші рішення з допомогою коротких шляхів і обґрунтованих припущень, коли обчислення ідеальних відповідей зайняло б занадто багато часу.
Всі учасники, включаючи OpenAI, були обмежені ідентичним обладнанням, наданим AtCoder, що забезпечувало рівні умови гри між учасниками-людьми і штучним інтелектом. Згідно з правилами конкурсу, учасники могли використовувати будь-яку мову програмування, доступну на AtCoder, без штрафу за повторну відправку, але з обов’язковим п’ятихвилинним очікуванням між відправками.
Остаточні результати конкурсу показали, що Psyho фінішував з результатом 1 812 272 558 909 балів, в той час як модель OpenAI (вказана як “OpenAIAHC”) набрала 1 654 725 675 406 балів — різниця приблизно в 9,5 відсотка. Штучний інтелект, схожий на o3, посів друге місце у загальному заліку, випередивши 10 інших програмістів-людей, які пройшли річну кваліфікацію.
OpenAI охарактеризувала фініш на другому місці як важливу віху для моделей штучного інтелекту в змагальному програмуванні.
Кодування – одне з найбільш частих застосувань чат-ботів від OpenAI, Anthropic, Google, Meta, а такі інструменти, як GitHub Copilot і Cursor, стали стандартними інструментами для багатьох професійних програмістів. Опитування GitHub 2024 року показав, що понад 90 відсотків розробників зараз використовують інструменти штучного інтелекту в своєму робочому процесі.
На даний момент людська здатність знаходити несподівані підходи залишається унікальною. Але у міру того, як OpenAI і інші компанії продовжують удосконалювати свої моделі, майбутні учасники AtCoder можуть виявити, що вони все менше виграють у штучного інтелекту.