Понеділок, 21 Липня, 2025

Програміст 10 годин боровся зі штучним інтелектом та ледь переміг

Польський програміст нещодавно домігся того, що незабаром може стати неможливим: переміг просунуту модель штучного інтелекту від OpenAI в очному змаганні з програмування. 10-годинний марафон залишив чоловіка “повністю виснаженим”.

Програміст Пшемислав Дэмбяк (відомий як “Psyho”), колишній співробітник OpenAI ледь переміг власну модель штучного інтелекту в евристичному конкурсі AtCoder World Tour Finals 2025 в Токіо.

AtCoder, японська платформа, яка проводить змагання з програмування, яка підтримує світові рейтинги, провела, можливо, перше змагання, в якому модель штучного інтелекту змагалася безпосередньо з кращими програмістами-людьми на великому локальному чемпіонаті світу.

Під час заходу виробник ChatGPT прийняв участь в якості спонсора і представив модель штучного інтелекту в спеціальному виставковому матчі під назвою “Люди проти штучного інтелекту”. Незважаючи на невтомний характер кремнію, ШІ зайняв друге місце.

“Людяність перемогла (на даний момент!)”, – написав Дэмбяк на X, зазначивши, що він мало спав, беручи участь у кількох змаганнях протягом трьох днів. “Я абсолютно виснажений. … Я ледь живий”.

Конкурс вимагав від учасників вирішення однієї складної оптимізаційної задачі протягом 600 хвилин. Змагання перегукується з американською народної казкою про Джона Генрі, сталевара, який у 1870-х роках змагався з паровою буровою машиною. Як і легендарна битва Генрі проти промислової автоматизації, перемога Дэмбяка свідчить про те, що людина-експерт доводить себе до фізичних меж, щоб довести, що людське майстерність все ще має значення в епоху штучного інтелекту.

В обох історіях розповідається про виснажливі змагання на витривалість — Генрі невпинно направляв сталеві шипи, поки у нього не відмовило серце, в той час як Дэмбяк кодувався протягом 10 годин мінімальним сном. Паралель поширюється на гірко-солодкий характер обох перемог: Генрі виграв гонку, але загинув від зусиль, символізуючи неминучий наступ автоматизації, в той час як визнання Дэмбьяком того, що людство перемогло “на даний момент”, припускає, що він визнає, що це може бути тимчасовим тріумфом над усе більше здатними машинами.

У той час як Дэмбяк виграв 500 000 ієн і пережив своє випробування краще, ніж легендарний сталевар, фінал AtCoder World Tour доводить людей і моделі штучного інтелекту до межі, вирішуючи складні завдання оптимізації, для яких немає ідеального рішення — тільки поступово поліпшуються.

Марафон кодування перевіряє витривалість людини на відповідність ефективності штучного інтелекту

Фінал AtCoder World Tour Finals являє собою одне з найбільш ексклюзивних заходів в області конкурсного програмування, на яке запрошені лише 12 кращих програмістів зі всього світу на основі їх результатів за попередній рік. Евристичний розділ фокусується на NP-жорстких задачах оптимізації. У програмуванні евристика – це методи вирішення проблем, які знаходять досить хороші рішення з допомогою коротких шляхів і обґрунтованих припущень, коли обчислення ідеальних відповідей зайняло б занадто багато часу.

Всі учасники, включаючи OpenAI, були обмежені ідентичним обладнанням, наданим AtCoder, що забезпечувало рівні умови гри між учасниками-людьми і штучним інтелектом. Згідно з правилами конкурсу, учасники могли використовувати будь-яку мову програмування, доступну на AtCoder, без штрафу за повторну відправку, але з обов’язковим п’ятихвилинним очікуванням між відправками.

Остаточні результати конкурсу показали, що Psyho фінішував з результатом 1 812 272 558 909 балів, в той час як модель OpenAI (вказана як “OpenAIAHC”) набрала 1 654 725 675 406 балів — різниця приблизно в 9,5 відсотка. Штучний інтелект, схожий на o3, посів друге місце у загальному заліку, випередивши 10 інших програмістів-людей, які пройшли річну кваліфікацію.

OpenAI охарактеризувала фініш на другому місці як важливу віху для моделей штучного інтелекту в змагальному програмуванні.

Кодування – одне з найбільш частих застосувань чат-ботів від OpenAI, Anthropic, Google, Meta, а такі інструменти, як GitHub Copilot і Cursor, стали стандартними інструментами для багатьох професійних програмістів. Опитування GitHub 2024 року показав, що понад 90 відсотків розробників зараз використовують інструменти штучного інтелекту в своєму робочому процесі.

На даний момент людська здатність знаходити несподівані підходи залишається унікальною. Але у міру того, як OpenAI і інші компанії продовжують удосконалювати свої моделі, майбутні учасники AtCoder можуть виявити, що вони все менше виграють у  штучного інтелекту.

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Євген
Євген
Євген пише для TechToday з 2012 року. Інженер за освітою. Захоплюється реставрацією старих автомобілів.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися

Статті