Искусственный интеллект может превзойти всех экспертов человечества за год – предсказывают те самые эксперты

31 марта 2026

Искусственный интеллект (ИИ) готов получить «отлично» по одному из самых сложных тестов знаний, известному как «Последний экзамен человечества» (HLE), уже через несколько месяцев. Разработчики утверждают, что эта проверка, состоящая из 2500 тщательно отобранных вопросов по сотне тем – от ракетостроения до мифологии и физиологии – требует уровня понимания, сравнимого с докторской степенью, и достижение даже близких к 100% результатов позволит получить титул «универсального эксперта».

Всего два года назад известный чат-бот ChatGPT от OpenAI набрал жалкие 3% на этом экзамене, а конкуренты из Google и Anthropic не продемонстрировали значительно лучших результатов. Тот тест якобы должен был успокоить опасения по поводу растущего доминирования ИИ, поскольку исследователи утверждали, что он выявил «существенный разрыв» между большими языковыми моделями (LLMs) и лучшими мировыми академиками.

Однако, казалось бы, невозможный HLE может оказаться лишь очередным этапом на пути неуклонного роста ИИ. В прошлом месяце Google Gemini продемонстрировал впечатляющие 45,9% на этом экзамене, а через несколько месяцев после первой попытки показал скачок до 18,8%. Полное освоение этого теста, как утверждают разработчики, находится уже на горизонте, о чем говорит Келвин Чжан, руководитель исследовательского отдела компании Scale, которая разработала HLE.

«Мы стремились создать этот замкнутый академический ориентир, установленный на уровне наиболее опытных людей, который реально может решить лишь небольшое количество людей на Земле,» – отметил Чжан. Он также добавил, что за последние несколько лет наблюдается «бешеный прогресс» в развитии языковых моделей, и разработчики моделей «действительно хорошо поработали» над улучшением их возможностей в области рассуждений.

Кейт Ольшевская, менеджер продукта в Google DeepMind, высказала мнение, что если бы этой проблемой занялись всерьез, то «достигли бы этого довольно быстро». Компания Anthropic, которая стоит за системой Claude AI, уже достигла 34,2% на HLE и демонстрирует быстрое улучшение своих результатов. Получение ИИ 100% на этом тесте будет значительным достижением, учитывая, что, по словам авторов, он «разработан как окончательный замкнутый академический ориентир своего рода».

Это означает, что если технология преодолеет HLE, то в будущем ее придется тестировать на вопросах, на которые не знают ответов ни один человек. Тест был создан исследователями из Scale и Центра безопасности ИИ, неприбыльной организации, для оценки как широты знаний ИИ, так и глубины его рассуждений. Эксперты из примерно 50 стран подали 70 000 вопросов для рассмотрения в ответ на глобальный призыв в сентябре 2024 года, в рамках которого был предложен призовой фонд в 500 000 долларов.

К вопросам выдвигались требования краткого, однозначного ответа, и чтобы их было трудно найти в Интернете. Список был сокращен до 13 000 после изъятия вопросов, на которые уже могли ответить существующие модели. Некоторые из 2500 отобранных вопросов впоследствии были удалены или изменены по результатам отзывов пользователей. Эти вопросы требуют широкого спектра знаний – от биологии до владения языками, и многие из них остаются в тайне, чтобы системы не могли воспользоваться общедоступной информацией об ответах.

Успех на HLE может напомнить победу суперкомпьютера IBM Deep Blue над чемпионом мира по шахматам Гарри Каспаровым в 1997 году, что противоречило прогнозам большинства экспертов. С тех пор был преодолен ряд важных тестов ИИ, в частности многодисциплинарный Massive Multitask Language Understanding, выпущенный в 2020 году, который был отменен, поскольку системы начали проходить его слишком легко, часто набирая более 90%. Ольшевская отметила, что по мере того, как ИИ приближается к уровню освоения тестов, созданных людьми, расширение за пределы существующих человеческих знаний становится основным фокусом разработчиков. Однако, по словам Чжана, всегда останется место для человеческого специализированного опыта, поскольку физические сферы, такие как хирургия, а также навыки, основанные на принятии решений, вроде суждения и креативности, будут оставаться более сложными для освоения ИИ.

Теги
Истории

191

НАПИСАТИ ВІДПОВІДЬ скасувати відповідь

Коментуйте, будь-ласка!

Будь ласка введіть ваше ім'я

Ви ввели некорректний Email

Ваш Email

Искусственный интеллект может превзойти всех экспертов человечества за год – предсказывают те самые эксперты

В магазинах Vodafone вместо документов можно показать смартфон

Эти смартфоны OnePlus стоимостью 350 долларов имеют аккумулятор большего размера, чем Galaxy S25 и iPhone 17 вместе взятые

Vodafone запустил 3G в Северодонецке и Рубежном и предоставляет 12 ГБ жителям

Мировые продажи iPhone могут установить новый рекорд

НАПИСАТИ ВІДПОВІДЬ скасувати відповідь

Vodafone

200 тысяч клиентов протестировали 5G в Харькове

Vodafone Ukraine построит современный подземный дата-центр

Vodafone Украина привлекла €30 млн финансирования для развития сети в сотрудничестве с Nokia, ING и Finnvera

Интернет Vodafone, работающий без электричества, охватил 2 млн домохозяйств

Vodafone добавил солнечную генерацию на первые 100 базовых станций

Статті

Как выходит, что вы обогнали кого-то на дороге, а он снова появляется впереди: ученые объяснили невидимую силу статистики

2026 год: хай-тек на грани краха, миллиарды исчезают, а пользователи становятся жертвами

Может ли искусственный интеллект генерировать новые идеи?

Можно ли остановить расплавление ядерного реактора?

Похоже, пары начали использовать чат-боты как замену реальных отношений

Империя наблюдения, которая отслеживала мировых лидеров, врага Ватикана и, возможно, вас

Производители скрывают истинную скорость USB-C на ноутбуке

ПОРАДИ

Как включить «Визуальный Интеллект» на macOS Golden Gate

Какие функции есть у Android для экономии времени

Как перезагрузить AirPods

СТАТТІ

Как выходит, что вы обогнали кого-то на дороге, а он снова появляется впереди: ученые объяснили невидимую силу статистики

2026 год: хай-тек на грани краха, миллиарды исчезают, а пользователи становятся жертвами

Может ли искусственный интеллект генерировать новые идеи?

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ

Искусственный интеллект может превзойти всех экспертов человечества за год – предсказывают те самые эксперты

НАПИСАТИ ВІДПОВІДЬ скасувати відповідь

Vodafone

Залишайтеся з нами

Статті

ПОРАДИ

СТАТТІ

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ