Apple обнаружила критические недостатки в логическом рассуждении искусственного интлекта

15 октября 2024

Исследовательская группа Apple по искусственному интеллекту выявила значительные недостатки в способности больших языковых моделей (она искусственного интеллекта) аргументировать. Исследование, опубликованное на arXiv, описывает оценку ряда ведущих языковых моделей, в том числе OpenAI, Meta и других известных разработчиков искусственных интеллектов, чтобы определить, насколько хорошо эти модели могут справляться с задачами математических соображений. Выводы показывают, что даже незначительные изменения в формулировке вопросов могут привести к серьезным различиям в производительности модели, что может подорвать ее надежность в сценариях, требующих логической согласованности.

Напомним, Apple выпустила iPhone 16, ключевой функцией которого должен стать искусственный интеллект Apple Intelligence. Этот интеллект еще недоступен пользователям, компания только начала ограниченное развертывание.

Apple обращает внимание на постоянную проблему языковых моделей: их работа на основе совпадения шаблонов, а не подлинного логического соображения. В нескольких тестах исследователи продемонстрировали, что добавление нерелевантной информации к вопросу — деталям, которые не должны влиять на математический результат, может привести к существенным отличиям ответов искусственного интеллекта.

Один из примеров, приведенный в статье, касается простой математической задачи: сколько киви человек собрал в течение нескольких дней. Когда были введены нерелевантные детали размера некоторых киви, такие модели, как o1 от OpenAI и Llama от Meta, неправильно рассчитала окончательную сумму.

«Мы не нашли доказательств формального размышления в языковых моделях. Их поведение лучше объяснить сложным шаблоном сопоставления — действительно настолько хрупким, что изменение имен может изменить результаты примерно на 10%.

Эта хрупкость результатов побудила исследователей к выводу, что искусственные интеллекты не используют реальную логику для решения проблем, а полагаются на сложное распознавание образов, полученных во время обучения.

Они обнаружили, что простое изменение имен может изменить результаты, потенциально тревожный знак для будущего приложений искусственного интеллекта, требующих последовательных и точных соображений в контексте реального мира.

Все проверенные модели от меньших версий с открытым исходным кодом, таких как Llama, до проприетарных моделей, таких как GPT-4o OpenAI, показали значительное снижение производительности, когда столкнулись с, казалось бы, несущественными вариациями входных данных.

Apple предполагает, что искусственному интеллекту может потребоваться сочетание нейронных сетей с традиционным символическим соображением, которое называется нейросимволическим искусственным интеллектом, чтобы получить более точные возможности принятия решений и решения проблем.

Теги
Истории

438

НАПИСАТИ ВІДПОВІДЬ скасувати відповідь

Коментуйте, будь-ласка!

Будь ласка введіть ваше ім'я

Ви ввели некорректний Email

Ваш Email

Apple обнаружила критические недостатки в логическом рассуждении искусственного интлекта

Лучшие приложения, чтобы сделать из Android телесуфлера и повысить качество своего контента на YouTube

Как восстановить удаленные контакты Gmail

AMD обещает экстремальные игровые ноутбуки в 2023 году с новым процессором Dragon Range

Презентация iPhone 8 поднимет волну анонсов: вендоры покажут, куда пойдет индустрия

НАПИСАТИ ВІДПОВІДЬ скасувати відповідь

Vodafone

Vodafone внедряет принцип «роуминг как дома» в контрактных и бизнес тарифах

Vodafone продлил акционное предложение на интернет для дома за 125 грн

Маленькие пациенты получили резервное тепло благодаря Vodafone

«Роуминг как дома» становится стандартом в тарифах Vodafone

Vodafone Украина вместе с абонентами помогли вылечить 289 детей

Статті

Директора компаний стоят очень дорого. Почему бы не автоматизировать их?

ИИ проникает в реальный мир в виде роботов-компаньонов и домашних животных.

Умные очки с необычными опциями появятся для вашего лица в 2026 году

Как ИИ генерирует изображения и видео? Почему ИИ-генератор называют «диффузией»?

Обзор Huawei Mate X7: смартфон с толщиной 4,5 мм

Мир еще не совсем готов к роботам-гуманоидам

Люди платят за то, чтобы их чат-боты с ИИ становились наркоманами

ПОРАДИ

Как отключить функции надоедания в Apple Watch

Как запустить практически любое приложение Windows в Linux

Как восстановить старый клиент WhatsApp в Windows 10 и 11

СТАТТІ

Директора компаний стоят очень дорого. Почему бы не автоматизировать их?

ИИ проникает в реальный мир в виде роботов-компаньонов и домашних животных.

Умные очки с необычными опциями появятся для вашего лица в 2026 году

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ

Apple обнаружила критические недостатки в логическом рассуждении искусственного интлекта

НАПИСАТИ ВІДПОВІДЬ скасувати відповідь

Vodafone

Залишайтеся з нами

Статті

ПОРАДИ

СТАТТІ

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ