Anthropic у вівторок представила свою нову модель Fable, позиціонуючи її як публічну та обмежену версію потужної й багато обговорюваної моделі кібербезпеки Mythos.

Втім, не всі задоволені такими обмеженнями: низка дослідників і фахівців з кібербезпеки вже публічно висловили невдоволення.
«[Fable] відхиляє будь-який запит, який хоча б віддалено стосується кібертематики. Навіть нешкідливі завдання, як-от прочитати допис у блозі», — сказала Валентина «Chompie» Пальміотті, відома дослідниця безпеки з IBM X-Force.
Коли запит спрацьовує на захисні обмеження, Fable призупиняє діалог і повідомляє, що «системи безпеки позначили це повідомлення як таке, що стосується кібербезпеки або біології».
Ці запобіжники запроваджені, щоб зменшити ризик використання Fable для розробки шкідливого ПЗ або компрометації програмного забезпечення — це давня занепокоєність Anthropic. Обмеження щодо біології пов’язані з подібними ризиками створення біологічної зброї.
Коли компанія у квітні випустила Mythos, доступ до моделі обмежили невеликою кількістю компаній та організацій у рамках проєкту Glasswing — ініціативи з використання моделі для захисту критичного ПЗ та інфраструктури. Минулого тижня Anthropic розширила доступ до Mythos для сотень організацій у 15 країнах.
Попри добрі наміри, багатьох експертів з кібербезпеки відштовхує хаотичний характер цих обмежень. Ветеран галузі Метт Суїш розповів TechCrunch, що «якщо попросити написати безпечний код, модель вважає, що це робота з кібербезпеки, а не найкращі практики програмної інженерії, і вас понижують у доступі». Якщо Fable натрапляє на обмеження, вона переключається на Claude Opus 4.8. «Схоже, це працює на основі ключових слів, тож будь-що з лексичного поля “кібербезпека” запускає ці запобіжники».
«Але це зрозуміло, ми все ще на ранньому етапі, і вони продовжують налаштовувати свої обмеження. Я впевнений, що з часом вони еволюціонуватимуть, оскільки Anthropic та інші розробники передових моделей більше співпрацюватимуть із новим поколінням компаній з кібербезпеки», — додав Суїш, співробітник технічної команди Tolmo, AI‑стартапу в галузі кібербезпеки. «Краще спершу “перестрахуватися” та зачепити більше випадків, а потім поступово послаблювати обмеження».
Ще один дослідник поскаржився в X, що навіть «звичайний запит на код-рев’ю» активує захисні механізми Fable.
Anthropic не надала коментар у відповідь на запит журналістів.


