Anthropic уперше виводить свою найпотужнішу модель ШІ до широкої аудиторії, але робить це з жорсткими обмеженнями безпеки.

У вівторок компанія запустила Claude Fable 5 — першу публічно доступну версію моделі Mythos. За словами Anthropic, Fable 5 особливо сильна в програмній інженерії, знаннєвій роботі та обробці зображень, однак має жорсткі ліміти безпеки. У високоризикових сферах, таких як кібербезпека, біологія, хімія та дистиляція знань, модель блокує відповіді та переходить до використання Claude Opus 4.8.
Mythos вперше запустили як превʼю у квітні, але доступ до нього отримала лише невелика кількість партнерів через занепокоєння з приводу кібербезпеки. Минулого тижня Anthropic розширила доступ до сотень організацій у 15 країнах, зосереджуючись на структурах, що керують критичною інфраструктурою.
Тепер версія цієї технології доступна всім через Claude API Anthropic та Enterprise-плани з оплатою за фактичне споживання. Доступ за підписками розгортатиметься поетапно: до 22 червня Fable 5 буде включено в плани Pro, Max, Team і Enterprise із оплатою за місце без додаткової доплати. 23 червня Anthropic приберe Fable 5 з цих планів, вимагаючи використання кредитів у подальшому, але планує якнайшвидше повернути його як стандартну функцію підписки.
Anthropic також розгортає нову версію Mythos — Mythos 5 — для організацій, які вже були схвалені для доступу до цієї просунутої моделі.
Запуск Fable відбувається на тлі підготовки Anthropic до виходу на публічні ринки разом з OpenAI та SpaceX Ілона Маска. Він також слідує за недавнім закликом компанії до провідних світових лабораторій ШІ узгодити «гальмо» для стримування розвитку передових моделей. Anthropic попереджає, що системи розвиваються настільки швидко, що незабаром можуть досягти рекурсивного самовдосконалення (RSI) — коли ШІ починає самостійно покращувати себе без втручання людини.
Остерігаючись того, на що може бути здатна модель рівня Mythos у «неправильних руках», Anthropic стверджує, що до запуску Fable 5 провела масштабне стрес-тестування класифікаторів на предмет «джейлбрейків».
«Всередині компанії ми провели зовнішній bug bounty, який не дав жодного універсального джейлбрейку більш ніж за 1 000 годин тестування. Потім ми співпрацювали з зовнішніми red-teaming організаціями, які також не змогли знайти універсальні джейлбрейки».
Водночас у майбутньому можуть зʼявитися нові типи атак. Тому разом із запуском Fable 5 та Mythos 5 Anthropic запроваджує обовʼязкове 30-денне зберігання всього трафіку, навіть якщо раніше для окремих підприємств діяли угоди про нульове зберігання. Компанія заявляє, що не використовуватиме ці дані для навчання моделей і застосовуватиме їх лише для «захисту від складних і нових атак, включно з новими джейлбрейками», а також для «виявлення та зниження кількості хибнопозитивних спрацювань». Ця політика може задати ринковий прецедент, коли доступ до дедалі потужніших моделей супроводжується обовʼязковими політиками зберігання даних під приводом безпеки.
Для користувачів моделі це означає, що не кожне запитання отримає відповідь саме від Fable 5. Anthropic стверджує, що випадки, коли Fable змушена віддавати відповідь Opus 4.8, є рідкісними: початкові дані показують, що щонайменше 95% сесій повністю обслуговуються відповідями Fable.
У сторонніх тестах аналітична компанія Hex заявила, що Fable стала першою моделлю, яка набрала 90% у її ключовому аналітичному бенчмарку складних, довготривалих аналітичних задач.
«На найскладніших запитаннях модель демонструє сильне судження та увагу до нюансів», — відзначили в Hex.
Платформа для «vibe-coding» Base44 у своїй заяві зазначила, що Fable краще «з першого разу збирає повноцінні застосунки» й має відмінні здібності до виклику інструментів. Платформа Genspark, що пропонує робочий простір і агентів на основі ШІ, сказала, що Fable перевершила всі інші моделі в її тестах і показала значно кращі результати в завданнях на проєктування інтерфейсів і розробку ігор.
Вартість використання Fable 5 і Mythos 5 становить 10 доларів за мільйон вхідних токенів і 50 доларів за мільйон вихідних — це вдвічі дорожче за Opus 4.8. Саме ціни можуть стати стримувальним фактором для масового використання.
Багато підприємств уже критично ставляться до витрат на ШІ після перших рахунків або ж передчасного вичерпання річних бюджетів на штучний інтелект. Просунуті моделі на кшталт Opus 4.8 тільки посилюють цю проблему, оскільки завдяки розширеним можливостям міркування здатні розбивати одне звернення на низку підзавдань.
Anthropic очікує, що попит на Fable 5 буде дуже високим і складним для прогнозування. І справді, деякі компанії, наприклад платформа кешбеків Rakuten, вважають, що потенційні переваги виправдовують ціну.
«На найвищому рівні зусиль Fable аналізує та перевіряє власну роботу», — заявили в Rakuten. «Для нас саме це робить можливими високий рівень автономності операцій — додаткове “мислення” саме себе окупає».


