Четверг, 30 апреля, 2026

ChatGPT победил клубнику, но клюква с автомойкой всё ещё вне его понимания

В последнее время вирусные публикации неизменно удивляют людей, демонстрируя, как самые современные чат-боты, такие как ChatGPT и Claude, способны решать чрезвычайно сложные уравнения, но в то же время отчаянно путаются в простых задачах. В частности, речь идет о подсчете количества букв «р» в слове «полуниця». Однако, похоже, этому противостоянию между человеческой простотой и машинной сложностью наконец настал конец, по крайней мере так утверждали разработчики.

С гордостью, которая чувствовалась даже через экран, официальный аккаунт ChatGPTapp в социальной сети X объявил: «Наконец-то!» По их словам, ChatGPT теперь способен сосчитать все буквы «р» в слове «полуниця» – задача, которая для человека является смехотворно легкой, но традиционно создавала значительные трудности для систем искусственного интеллекта. Это заявление должно было бы ознаменовать новую эру в логических способностях ИИ, однако энтузиазм быстро сменился скепсисом.

Однако радость разработчиков была несколько преждевременной, ведь пользователи не замедлили обнаружить пробелы в этих новых «способностях». Стоило лишь заменить «полуницю» на «журавлину», как система снова забывала о своем новообретенном мастерстве.

Причина, почему «клубничная проблема» существует, заключается в особенности обработки языка большими языковыми моделями (LLM). Они построены на архитектуре трансформеров, которые преобразуют слова, такие как «полуниця», в числовые представления. Эти представления прекрасно улавливают значение и контекст, но они не сохраняют четкого осознания отдельных букв, составляющих слово. Поэтому для ИИ это не просто буквы, а сложная последовательность абстрактных данных.

Тот факт, что ChatGPT продолжает спотыкаться на «журавлине», несмотря на «решение» «клубничной» проблемы, наталкивает на мысль. Возможно, это «решение» было не системным улучшением понимания LLM принципа подсчета букв, а скорее «заплатой» или «жестко закодированным» решением для конкретных, известных случаев. Это не отражает более широкого прогресса в том, как модель обрабатывает подобные лингвистические задачи.

Помимо буквенных головоломок, в сообщении ChatGPTapp также речь шла о решении так называемой «проблемы автомойки». Эта задача эксплуатирует пробелы в логике LLM, задавая вопрос: что будет быстрее – пройти пешком до автомойки или доехать на машине, если она «всего в 50 метрах»? Большинство ранних моделей отвечали, что быстрее пройтись, полностью игнорируя очевидный факт: чтобы помыть авто, его необходимо привезти с собой.

ChatGPTapp торжественно заявляет, что ChatGPT теперь способен выявлять эту логическую ошибку и указывать на нее. Однако, когда я попробовал это с помощью последней модели GPT-5.5, она все равно рекомендовала идти пешком, так же как и Claude, используя модель Sonnet 4.6. Кажется, даже «решение» известных проблем не всегда гарантирует ожидаемый результат.

Однако не все ИИ такие забывчивые. Во время тестирования Gemini, эта модель указала, что хотя пешком было бы быстрее, для выполнения задачи (мытья машины) необходимо иметь ее при себе. Grok справился еще лучше: он не только отметил проблему отсутствия автомобиля, но и добавил, что «этот вопрос стал популярным тестом на то, понимает ли кто-то (или ИИ) настоящую цель, вместо того чтобы давать общие советы типа ‘ходьба полезнее/короче/экологичнее’, которые игнорируют контекст».

Итак, по крайней мере на данный момент, это безоговорочная победа для Gemini и Grok в этом логическом состязании. Если же исправление «клубники» не способно решить «клюкву», это вызывает значительно более широкий и глубокий вопрос: действительно ли эти модели становятся умнее, или они просто учатся лучше проходить те конкретные тесты, которые мы им постоянно подбрасываем, не развивая при этом настоящего, адаптивного мышления?

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Євген
Євген
Евгений пишет для TechToday с 2012 года. По образованию инженер,. Увлекается реставрацией старых автомобилей.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися

Статті