Воскресенье, 12 апреля, 2026

Профессиональные математики ошеломлены прогрессом любителей ИИ в решении сложных математических задач

Мматематики-любители начали использовать чат-боты с искусственным интеллектом для решения давних математических проблем, что стало неожиданностью для профессионального сообщества. Хотя речь идет не о самых сложных задачах в математическом каноне, успех моделей искусственного интеллекта в работе с ними, по словам исследователей, свидетельствует о преодолении важного порога в математических возможностях таких систем и потенциально может коренным образом изменить способ, которым осуществляется математическое исследование.

Вопросы, которые в настоящее время решаются с помощью искусственного интеллекта, исходят от венгерского математика Пола Эрдеша, известного своей способностью формулировать полезные, но в то же время чрезвычайно сложные задачи на протяжении более шести десятилетий карьеры. По словам Томаса Блума из Манчестерского университета в Великобритании, эти вопросы обычно были очень простыми по формулировке, но чрезвычайно трудными по содержанию. На момент смерти Эрдеша в 1996 году существовало более тысячи неразрешимых задач, охватывающих широкий спектр математических дисциплин, от комбинаторики, изучающей комбинацию, до теории чисел. Сейчас эти задачи рассматриваются как ориентиры прогресса в соответствующих областях, отмечает Блум, который ведет вебсайт с каталогизацией этих проблем и отслеживанием прогресса математиков в их решении.

Поскольку задачи Эрдеша часто легко формулируются, математики начали экспериментировать с их представлением инструментам искусственного интеллекта, в частности ChatGPT. По словам Блума, в октябре прошлого года он начал замечать, что люди используют модели искусственного интеллекта для поиска релевантных ссылок в математической литературе, которые помогли в создании решений.

Вскоре после этого инструменты искусственного интеллекта начали находить частичные улучшения известных результатов, некоторые из которых уже появлялись в предыдущих научных публикациях, в то время как другие выглядели новыми. Блум отмечает, что был удивлен таким развитием событий, поскольку ранее при попытках использования ChatGPT система придумывала несуществующие статьи, фактически галлюцинируя, из-за чего от ее применения было отказано. В то же время примерно с октября произошли заметные изменения, и система начала находить настоящие научные труды, которые она, как оказалось, проработала полностью и часто нетривиальным способом.

Вдохновленные этим прогрессом, Кевин Баррето, студент бакалавриата по математике в Кембриджском университете, и Лиам Прайс, математик-любитель, начали искать простые и малоизученные задачи Эрдеша, которые можно было бы попытаться решить с помощью искусственного интеллекта. После обнаружения одной из таких задач, под номером 728, являющейся гипотезой из теории чисел, она была представлена на решение модели ChatGPT-5.2 Pro.

По словам Баррето, после ознакомления с формулировкой возникло предположение, что эта задача может быть доступна для решения с помощью ChatGPT, и соответствующая попытка была осуществлена. В ответ система предоставила аргумент, который многие специалисты сочли довольно сложным и концептуально сложным. После того, как ChatGPT сгенерировал доказательства, Баррето и Прайс использовали другой инструмент искусственного интеллекта под названием Aristotle, созданный Harmonic. Этот инструмент превращает традиционное текстовое доказательство в форму, записанную на языке Lean, который является языком математического программирования. После этого результат может быть мгновенно проверен компьютером на корректность. По словам Блума, этот этап чрезвычайно важен, поскольку позволяет сэкономить ограниченное время исследователей, которое обычно тратится на проверку правильности результатов.

По состоянию на середину января шесть задач Эрдеша были полностью решены с помощью инструментов искусственного интеллекта, однако дальнейший анализ со стороны профессиональных математиков показал, что пять из этих задач уже имели решение в научной литературе. Только одна задача под номером 205 была полностью решена Баррето и Прайсом без какого-либо ранее известного решения. Кроме этого, инструменты искусственного интеллекта способствовали незначительным улучшениям и частичным решениям еще семи задач, для которых не выявлено предыдущих аналогов в литературе.

В связи с этим продолжается дискуссия о том, действительно ли такие инструменты создают новые идеи или только отнекиваются старые и забытые решения. Блум обращает внимание на то, что модели искусственного интеллекта часто вынуждены переводить задачи в другие формальные формы и при этом находят научные работы, в которых имя Эрдеша вообще не упоминается. По его словам, значительную часть таких публикаций он самостоятельно не смог бы найти, и, вероятно, они оставались бы без внимания значительно дольше без использования инструментов искусственного интеллекта.

Другим открытым вопросом остается предел применения такого подхода. Хотя все эти задачи не являются одними из самых сложных в математике и теоретически могут быть решены аспирантом первого года обучения, сам факт того, что искусственный интеллект способен выполнять аналогичную работу, впечатляет, отмечает Блум, поскольку для этого требуются нетривиальные интеллектуальные усилия. После того как ChatGPT сгенерировал доводку, Баррето и Прайс снова воспользовались инструментом Aristotle, созданным компанией Harmonic, который превращает текстовую доводку в формальную запись на языке Lean и позволяет мгновенно проверить его корректность. Блум подчеркивает, что это существенно снижает нагрузку на исследователей, у которых есть ограниченное время для ручной проверки результатов.

По состоянию на середину января шесть задач Эрдеша были полностью решены с помощью инструментов искусственного интеллекта, однако дальнейшая проверка профессиональными математиками показала, что пять из них уже были решены ранее. Только задача номер 205 была полностью решена Баррето и Прайсом без наличия предыдущего известного решения. Кроме того, инструменты искусственного интеллекта позволили получить частичные результаты и небольшие улучшения для еще семи задач, которые, вероятно, не имели аналогов в существующей научной литературе.

В итоге продолжается обсуждение того, создают ли эти инструменты действительно новые математические идеи или лишь эффективно извлекают из массивов знаний старые и малоизвестные результаты. Блум отмечает, что модели искусственного интеллекта часто меняют форму представления задач и находят научные работы, которые не содержат никаких упоминаний об Эрдеше, и что без такого инструментария эти материалы могли бы оставаться незамеченными еще длительное время.

Отдельно встает вопрос масштабов применения этого подхода. Хотя рассматриваемые задачи не являются самыми требовательными в математике и могли бы быть выполнены аспирантом начального уровня, сам факт их успешного решения с помощью искусственного интеллекта остается показательным. Блум подчеркивает, что это требует значительных интеллектуальных усилий, и поэтому способность систем искусственного интеллекта выполнять такую работу является существенным достижением.

Математики часто вынуждены сосредотачиваться на небольшом количестве чрезвычайно сложных проблем из-за нехватки времени, в то время как многие из менее сложных, но все же важных задач упускаются из виду. По словам Терренса Тао, если инструменты искусственного интеллекта можно будет применять к большому количеству таких задач одновременно, это может привести к более эмпирическому, почти научно-экспериментальному подходу к математике, в рамках которого различные методы решения можно будет тестировать в масштабе.

Тао отмечает, что сообщество чрезвычайно ограничено в объеме экспертного внимания, из-за чего около девяноста девяти процентов потенциально интересных задач остаются неисследованными. В результате не проводятся систематические обзоры сотен проблем с целью найти действительно перспективные направления или статистические исследования вроде сравнения эффективности различных методов. По его словам, такой тип математики фактически не практикуется из-за нехватки интеллектуальных ресурсов, однако применение искусственного интеллекта демонстрирует, что масштабная математика в принципе возможна.

По матеріалам: New Scientist

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Євген
Євген
Евгений пишет для TechToday с 2012 года. По образованию инженер,. Увлекается реставрацией старых автомобилей.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися

Статті