Apple виявила критичні недоліки в логічному міркуванні штучного інтлекту

15 Жовтня 2024

Дослідницька група Apple зі штучного інтелекту виявила значні недоліки в здатності великих мовних моделей (онова штучного інтелекту) аргументувати. Дослідження, опубліковане на arXiv, описує оцінку низки провідних мовних моделей, у тому числі від OpenAI, Meta та інших відомих розробників штучних інтелектів, щоб визначити, наскільки добре ці моделі можуть справлятися із завданнями математичних міркувань. Висновки показують, що навіть незначні зміни у формулюванні запитань можуть спричинити серйозні розбіжності в продуктивності моделі, що може підірвати її надійність у сценаріях, які вимагають логічної узгодженості.

Нагадаэмо, Apple випустила iPhone 16, ключовою функцією якого має стати штучний інтелект Apple Intelligence. Цей інтелект ще недоступний користувачам, компанія лише почала обмежене розгортання..

Apple звертає увагу на постійну проблему мовних моделей: їх робота на основі співпадіння шаблонів, а не справжнього логічного міркування. У кількох тестах дослідники продемонстрували, що додавання нерелевантної інформації до запитання — деталей, які не повинні впливати на математичний результат — може призвести до суттєвих відмінностей відповідей штучного інтелекту.

Один із прикладів, наведений у статті, стосується простої математичної задачі: скільки ківі людина зібрала протягом кількох днів. Коли були введені нерелевантні деталі щодо розміру деяких ківі, такі моделі, як o1 від OpenAI та Llama від Meta, неправильно розрахувала остаточну суму.

«Ми не знайшли доказів формального міркування в мовних моделях. Їхню поведінку краще пояснити складним шаблоном зіставлення — насправді настільки крихким, що зміна імен може змінити результати приблизно на 10%.

Ця крихкість результатів спонукала дослідників до висновку, що штучні інтелекти не використовують реальну логіку для вирішення проблем, а натомість покладаються на складне розпізнавання образів, отриманих під час навчання.

Вони виявили, що проста зміна імен може змінити результати, потенційно тривожний знак для майбутнього додатків штучного інтелекту, які вимагають послідовних і точних міркувань у контексті реального світу.

Усі перевірені моделі, від менших версій з відкритим вихідним кодом, таких як Llama, до пропрієтарних моделей, таких як GPT-4o OpenAI, показали значне зниження продуктивності, коли зіткнулися з, здавалося б, несуттєвими варіаціями вхідних даних.

Apple припускає, що штучному інтелекту може знадобитися поєднати нейронні мережі з традиційним символічним міркуванням, яке називається нейросимволічним штучним інтелектом , щоб отримати точніші можливості прийняття рішень і вирішення проблем.

Теги
Історії

761

НАПИСАТИ ВІДПОВІДЬ скасувати відповідь

Коментуйте, будь-ласка!

Будь ласка введіть ваше ім'я

Ви ввели некорректний Email

Ваш Email

Apple виявила критичні недоліки в логічному міркуванні штучного інтлекту

Не купуйте в Європі привезені із США Vision Pro: гаджет не працюватиме

Месенджер Tinfoil Chat потребує трьох ПК для спілкування

Як у Windows 10 отримати меню з інформацією про батарею в стилі попередніх Windows

Більше 2,6 млрд зламаних акаунтів у 2017 році

НАПИСАТИ ВІДПОВІДЬ скасувати відповідь

Vodafone

Vodafone інвестував у ветеранські бізнеси ще 1 млн грн

Домашній інтернет Vodafone очолив міжнародний рейтинг nPerf

Абоненти Vodafone зможуть отримувати швидкісний інтернет за відсутності мобільної мережі – через супутник

Старт 7-го сезону Big Data Lab: Vodafone готує Data Scientists для українського ринку

Результати «Роумінг як вдома» – понад 900 тисяч користувачів за місяць

Статті

Росія сховала 100 млрд у крипті

Термін дії сертифікатів Secure Boot завершується: що це означає для вашого ПК

Електроенергетика в даний час стримує зростання світової економіки

HDMI 2.2: Фантазії 12K та 480 Гц залишаються лише мріями

Огляд Moto G & G Play (2026): повне “фе”. Однак у нього є роз’єм 3,5 мм аудіо та слот microSD

Голлівуд протистоїть AI-згенерованим діпфейкам: актори у центрі скандалу

Штучний інтелект змінює ринок праці: передвістя великих трансформацій

ПОРАДИ

Windows 11 може працювати швидше. П’ять дієвих налаштувань пришвидшення Windows

Як послідовно підключити кілька моніторів за допомогою одного кабелю

Як зменшити нагрів та енергоспоживання відеокарти при збереженні її продуктивності

СТАТТІ

Росія сховала 100 млрд у крипті

Термін дії сертифікатів Secure Boot завершується: що це означає для вашого ПК

Електроенергетика в даний час стримує зростання світової економіки

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ

Apple виявила критичні недоліки в логічному міркуванні штучного інтлекту

НАПИСАТИ ВІДПОВІДЬ скасувати відповідь

Vodafone

Залишайтеся з нами

Статті

ПОРАДИ

СТАТТІ

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ