Anthropic кілька місяців тому запустила закриту ініціативу Project Glasswing — програму для обмеженого кола партнерів, які отримали доступ до спеціалізованої моделі Mythos для дослідження вразливостей. Серед перших учасників — Cloudflare та, нещодавно, IBM. Хоча саму модель досі не відкрили для широкого ринку, Anthropic від початку пообіцяла, що ключові уроки Glasswing будуть передані всій кіберспільноті. Тепер, після пом’якшення режиму конфіденційності для учасників, ці уроки починають виходити назовні.
![]()
Один із перших детальних публічних звітів опублікувала Cloudflare, описавши, як Mythos використовувався для аналізу понад 50 репозиторіїв коду. На основі цього досвіду та обговорення на подкасті IBM Security Intelligence вимальовується важливий тренд: сам по собі «фронтирний» LLM ще не є магічним сканером вразливостей. Різницю робить те, як саме його вбудовують у процеси — через кастомні «harness»-системи, набір вузьких агентів і ретельну перевірку результатів.
Від закритого експерименту до спільних уроків
На старті Project Glasswing Anthropic чітко розділила дві площини: доступ до самої моделі Mythos та доступ до знань, які з нею здобуваються. Модель залишилася ексклюзивною для партнерів, але компанія публічно пообіцяла, що напрацювання Glasswing не залишаться всередині закритого клубу. Тепер ця обіцянка починає матеріалізуватися.
Anthropic послабила початкові угоди про конфіденційність для учасників Glasswing, дозволивши їм вільніше ділитися деталями експериментів, знайдених загроз та методик. Це відкриває вікно в те, як виглядає реальне застосування «фронтирних» моделей у безпеці — не в рекламних презентаціях, а в бойових умовах великих інфраструктур.
Cloudflare стала одним із перших гравців, які винесли цей досвід у публічний простір. Компанія описала, як дала Mythos «подивитися» на понад 50 репозиторіїв коду, і що з цього вийшло. Паралельно до Glasswing приєдналася IBM, що додає ваги проєкту: до спільного експерименту підключаються гравці, які самі будують AI-продукти для безпеки й добре розуміють обмеження технології.
Цей перехід від повної закритості до контрольованого розкриття — важливий сигнал для ринку. Моделі рівня Mythos, які можуть будувати експлойт-ланцюжки та генерувати PoC, мають очевидний подвійний потенціал. Тому замість відкривати доступ до самої моделі, Glasswing спершу відкриває доступ до методології: як безпечно й ефективно працювати з такими інструментами.
У чому Mythos справді сильний: експлойт-ланцюжки та PoC
Cloudflare тестувала Mythos як інструмент для пошуку вразливостей у власних кодових базах. Після аналізу понад 50 репозиторіїв компанія виділила дві ключові сильні сторони моделі, які відрізняють її від більшості LLM, що вже використовуються в безпеці.
По-перше, Mythos добре вміє будувати ланцюжки експлойтів. Йдеться не просто про виявлення окремих потенційних багів, а про здатність «зшивати» кілька дрібних, на перший погляд незначних, недоліків у повноцінний сценарій атаки. Це ближче до мислення досвідченого пентестера, ніж до класичного статичного аналізу коду. Модель не зупиняється на констатації: «ось підозрілий фрагмент», а намагається показати, як із цього фрагмента, у поєднанні з іншими, можна дійти до реального компромісу системи.
По-друге, Mythos виявився сильним у генерації proof-of-concept експлойтів. Там, де багато моделей обмежуються описовою відповіддю або загальними рекомендаціями, Mythos здатен видати робочий PoC, який демонструє експлуатованість знайденої проблеми. Для команд безпеки це критично: наявність PoC різко підвищує пріоритет виправлення, а також дозволяє швидко відтворити атаку в контрольованому середовищі.
У поєднанні ці дві властивості роблять Mythos корисним саме в «офенсивному» стилі тестування — коли завдання полягає не лише в тому, щоб знайти слабкі місця, а й зрозуміти, як ними реально може скористатися зловмисник. Проте Cloudflare швидко з’ясувала, що просто дати такій моделі доступ до великої кодової бази й сказати «знайди вразливості» — майже гарантований шлях до розчарування.
Чому «просто запустити AI по коду» не працює
Один із найцікавіших висновків Cloudflare стосується того, як саме не варто використовувати Mythos. Інтуїтивний підхід виглядає привабливо: є потужна модель, є десятки репозиторіїв — чому б не надіслати їй запит на кшталт «проскануй усе й розкажи, що знайшла»?
На практиці це виявилося неефективним з кількох причин.
По-перше, обмеження контекстного вікна. Навіть великі LLM не можуть одночасно «тримати в голові» цілі монолітні кодові бази або десятки репозиторіїв. Коли Cloudflare намагалася змусити Mythos одразу дивитися на багато репозиторіїв, контекст швидко заповнювався, і модель починала «розмазуватися» по поверхні, втрачаючи фокус.
По-друге, «блукання» моделі. Без чіткої постановки задачі й структурованого процесу Mythos, як і інші LLM, схильний відходити вбік: аналізувати не ті частини коду, занадто узагальнювати, генерувати багато шуму замість точкових знахідок. Це не стільки проблема «інтелекту» моделі, скільки проблема відсутності рамок, у яких вона має працювати.
По-третє, без оркестрації модель поводиться як один універсальний «генераліст», який намагається робити все й одразу. У безпеці це рідко працює добре. Людські команди давно перейшли до спеціалізації: одні фахівці займаються реверс-інжинірингом, інші — веб-додатками, треті — хмарною інфраструктурою. Спроба покласти весь спектр завдань на одну модель без додаткової логіки призводить до того, що вона робить усе посередньо.
У результаті Cloudflare дійшла висновку: «наївне» використання Mythos як універсального сканера — хибний шлях. Щоб отримати реальну користь, потрібен проміжний шар — те, що в компанії й на подкасті називають harness.
Harness як головний інструмент: розбити завдання на агентів
У дискусії навколо Glasswing постійно звучить одна теза: кастомний harness — найважливіша частина роботи з Mythos. І це не просто технічний аксесуар, а фактично новий рівень архітектури безпекових інструментів.
Cloudflare побудувала власний harness, який розбиває процес пошуку вразливостей на низку окремих кроків і координує роботу кількох спеціалізованих агентів. Замість того, щоб доручати Mythos «зробити все», компанія створила систему, де кожен агент відповідає за конкретну, вузьку задачу, а результати передаються далі по ланцюжку.
Цей підхід нагадує класичну філософію Unix і Linux: багато маленьких утиліт, кожна з яких робить одну річ, але робить її добре, а складні завдання вирішуються шляхом їх комбінування. У випадку з Mythos роль таких «утиліт» виконують агенти, які можуть бути як окремими викликами тієї ж моделі з різними промптами, так і поєднанням Mythos з іншими інструментами.
Панелісти IBM наголошують: саме такий harness, а не сама модель, є ключем до ефективності. Це стосується не лише Mythos, а й будь-яких «фронтирних» LLM у безпеці. Без проміжного шару оркестрації організація отримує або надто загальні результати, або потопає в шумі. З добре спроєктованим harness — отримує керований, відтворюваний процес, який можна інтегрувати в існуючі пайплайни CI/CD та системи управління вразливостями.
Цікаво, що такий підхід не є чимось радикально новим для кібербезпеки. Досвідчені дослідники вразливостей і раніше працювали «каскадами» інструментів і кроків: від попереднього сканування до глибокого аналізу, від ручного аудиту до побудови експлойтів. Тепер ці ж принципи просто переносяться в світ LLM і агентних систем.
Маленькі спеціалізовані моделі проти одного «всемогутнього» LLM
Ще один важливий висновок, який підкреслили учасники панелі: Mythos та інші великі моделі не повинні сприйматися як «одна модель, що робить усе». Навпаки, досвід Cloudflare та позиція IBM збігаються в тому, що найкращі результати дають невеликі, сфокусовані, цільові моделі або агенти.
Це перегукується з ширшим трендом в індустрії: відмовою від ідеї «one model to rule them all» на користь екосистеми спеціалізованих інструментів. У безпеці це особливо помітно. Завдання надто різні: аналіз вихідного коду, пошук конфігураційних помилок у хмарі, виявлення аномалій у логах, моделювання ланцюжків атак. Очікувати, що одна й та сама модель буде однаково добре виконувати всі ці ролі, — нереалістично.
У контексті Glasswing це означає, що Mythos варто розглядати як один із елементів ширшої системи. Він може бути надзвичайно корисним там, де потрібне «офенсивне» мислення: побудова експлойт-ланцюжків, генерація PoC, моделювання поведінки зловмисника. Але для інших задач — наприклад, масового статичного аналізу чи класифікації логів — цілком можуть виявитися ефективнішими менші, спеціально натреновані моделі.
IBM, яка активно просуває концепцію purpose-built моделей, у цьому контексті виглядає послідовно: замість того, щоб «кидати» гігантський LLM на будь-яку задачу, компанія виступає за побудову набору вузьких агентів, кожен з яких добре робить свою справу й мінімізує шум. Cloudflare фактично підтвердила цю стратегію на практиці: там, де Mythos працював як частина оркестрованої системи, результати були значно кориснішими, ніж у «монолітному» режимі.
Mythos як ще один сканер, а не «чарівна паличка»
Попри вражаючі можливості Mythos у побудові експлойтів, учасники Glasswing обережні в оцінках. На панелі IBM підкреслюють: такі моделі слід сприймати як додатковий скан-інструмент, а не як самодостатнє рішення безпеки.
Це важливий нюанс. У багатьох організаціях уже є цілий зоопарк сканерів: SAST, DAST, SCA, інструменти аналізу контейнерів, хмарних конфігурацій тощо. Mythos і подібні моделі додаються до цього набору як ще один шар, який може знайти те, що пропустили класичні інструменти, або швидко перевірити гіпотези, які раніше вимагали багато ручної роботи.
Такий підхід знижує ризик «перекладання відповідальності» на AI. Якщо розглядати Mythos як ще один сканер, його результати автоматично потрапляють у вже знайомий процес: кореляція знахідок, пріоритизація, ручна валідація, планування виправлень. Це краще, ніж будувати окремий, паралельний всьому іншому «AI-процес», який живе за власними правилами.
Панелісти також проводять цікаву аналогію: AI-системи на кшталт Mythos — це «дуже швидкі люди всередині мережі». Вони можуть робити корисні речі, але потребують тих самих принципів управління, що й людські оператори: чітких прав доступу, контролю дій, логування, обмеження повноважень. Якщо дати такій системі надто широкий мандат без належних обмежень, вона може не лише знайти вразливості, а й ненавмисно створити нові ризики.
Архітектура важливіша за «швидкість патчів»
Окрема частина висновків Cloudflare стосується того, як саме організації мають мислити про безпеку в епоху швидких AI-сканерів. Найгучніша реакція на Mythos з боку інших лідерів безпеки, за словами компанії, стосувалася швидкості: «скануйте швидше, патчіть швидше, стискайте цикл реагування».
Cloudflare, однак, робить інший акцент. На їхню думку, важливіше не стільки прискорювати патчинг, скільки будувати таку архітектуру, яка ускладнює експлуатацію навіть за наявності вразливості. Інакше кажучи, якщо система спроєктована так, що шлях від багу до повного компромісу довгий і складний, то часовий проміжок між виявленням і виправленням стає менш критичним.
Це повертає дискусію до базових принципів: сегментації мережі, мінімізації привілеїв, захисту за принципом «zero trust», внутрішніх контролів. AI-сканери можуть допомогти швидше знаходити проблеми, але якщо архітектура дозволяє одній помилці миттєво призвести до катастрофи, жодна швидкість патчів не врятує.
У цьому сенсі Mythos і подібні інструменти радше підсвічують слабкі місця архітектури, ніж вирішують їх. Якщо модель легко будує експлойт-ланцюжки через кілька сервісів, це сигнал не лише про окремі баги, а й про те, що між цими сервісами надто мало бар’єрів.
Чому «довіряй, але перевіряй» залишається обов’язковим
Навіть найсильніші моделі помиляються. У контексті Glasswing це не теоретичне застереження, а практичний факт. Один із показових прикладів, який обговорювали на панелі, — досвід автора curl Даніеля Стенберга. Він прогнав свій проєкт через Mythos і отримав п’ять нібито вразливостей. Після перевірки справжньою виявилася лише одна — і то незначна.
Цей кейс добре ілюструє, чому організаціям не можна сліпо довіряти виводу навіть «фронтирних» моделей. Mythos може генерувати переконливі описи вразливостей і PoC, але це не гарантує, що проблема реальна або експлуатована в реальних умовах. Як і в класичних сканерах, тут неминучі false positives.
Панелісти наполягають: будь-які знайдені Mythos вразливості та PoC мають проходити QA з використанням іншої модельної бази. Іншими словами, якщо один LLM «каже», що знайшов проблему, варто перевірити це за допомогою іншої моделі або інструменту, а потім — руками інженера. Це не лише знижує ризик помилкових спрацювань, а й дає змогу виявити випадки, коли модель «галюцинує» деталі експлойту.
Такий підхід добре вписується в загальну логіку багаторівневої безпеки. Як і в інших сферах, де використовується AI, принцип «довіряй, але перевіряй» залишається обов’язковим. Моделі можуть значно прискорити пошук потенційних проблем, але остаточне рішення про їхню реальність і критичність усе ще має ухвалювати людина, спираючись на кілька незалежних джерел.
Чому варто брати участь у Glasswing, якщо ви пишете код
Попри всі застереження, учасники панелі одностайні в одному: якщо ви — підприємство, яке будує програмне забезпечення, варто брати участь у Glasswing і тестувати свій код із Mythos. Аргументація проста: навіть якщо модель не ідеальна, вона дає новий ракурс на знайомі проблеми й може виявити ланцюжки експлойтів, які неочевидні для класичних інструментів.
Участь у Glasswing також дає змогу раніше за інших відпрацювати внутрішні процеси роботи з такими моделями: як будувати harness, як інтегрувати AI-сканери в CI/CD, як організувати валідацію результатів, які політики доступу потрібні для «дуже швидких людей» усередині вашої мережі. Це свого роду полігон, де можна експериментувати в контрольованих умовах, перш ніж подібні інструменти стануть масовими.
Для ринку в цілому це означає, що Glasswing поступово перетворюється з закритого експерименту на майданчик колективного навчання. Anthropic не відкриває сам Mythos, але дозволяє партнерам ділитися тим, як вони з ним працюють. Cloudflare вже зробила перший крок, IBM приєдналася до проєкту, і можна очікувати, що в найближчий час з’явиться більше публічних кейсів.
Висновок: AI як прискорювач, а не заміна безпеки
Перші публічні результати Project Glasswing показують, що Mythos — потужний, але вимогливий інструмент. Його сила — у здатності мислити як атакувальник: будувати складні ланцюжки експлойтів і швидко генерувати PoC. Але без добре спроєктованого harness, без набору спеціалізованих агентів і без суворої валідації результатів ця сила легко перетворюється на шум.
Головний урок, який сьогодні транслюють учасники Glasswing, полягає в тому, що «фронтирні» моделі не скасовують базових принципів кібербезпеки. Потрібні багаторівнева архітектура, мінімізація привілеїв, контроль доступу, людська експертиза й здоровий скепсис до будь-яких автоматизованих висновків. Mythos і подібні системи додають до цього набору новий, дуже швидкий інструмент, але не замінюють його.
У найближчі місяці, коли інші партнери Glasswing почнуть ділитися власними кейсами, ринок отримає більше конкретики: які саме патерни вразливостей моделі знаходять краще за людей і класичні сканери, які типи помилок вони пропускають, як змінюються процеси розробки й тестування. Але вже зараз зрозуміло одне: майбутнє AI у безпеці — це не один «всемогутній» LLM, а екосистема спеціалізованих агентів, об’єднаних розумним harness і вбудованих у перевірені часом практики кібергігієни.


