Вівторок, 14 Квітня, 2026

Claude Mythos: новий клас AI-моделей, який змінює правила гри для софту

Anthropic, компанія, відома лінійкою моделей Claude, офіційно підтвердила існування внутрішньої «фронтирної» моделі Claude Mythos. Про неї стало відомо завдяки анонсу ініціативи Project Glass Wing та публікації системної карти обсягом 244 сторінки, де описано тренування й можливості системи. За масштабом, продуктивністю та обмеженим доступом Mythos уже встигла стати однією з найобговорюваніших AI?новинок року.

Anthropic Just Broke Software Forever

Це не чергове оновлення Opus і не «версія 5.0». Mythos позиціонують як окремий, вищий щабель у розвитку великих мовних моделей: загального призначення, але з особливою силою в програмуванні, аналізі коду та складному технічному міркуванні. Поки що доступ до неї мають лише найбільші гравці на кшталт AWS, Apple, Microsoft, Google, CrowdStrike та JPMorgan — і це не випадковість, а частина стратегії безпечного розгортання.

Новий рівень: чим Claude Mythos відрізняється від Opus

Anthropic прямо відмежовує Claude Mythos від попередніх моделей Opus 4.7 та Opus 5.0. Йдеться не про еволюційне оновлення, а про «повністю новий рівень» моделі. У практичному вимірі це означає кілька речей.

По?перше, Mythos описують як загальнопридатну фронтирну систему. Вона не обмежена вузькими задачами, але її пікова зона — саме програмна інженерія та робота з кодом. Це не просто «ще один хороший кодер?бот», а модель, яка демонструє стрибок у реальних, а не синтетичних, бенчмарках розробки.

По?друге, Anthropic оприлюднила безпрецедентно велику системну карту — 244 сторінки. Такий документ зазвичай містить опис архітектури, тренувальних даних, процедур безпеки, відомих ризиків і сфер застосування. Сам факт обсягу свідчить, що компанія готується до моделі, яка матиме системний вплив на індустрію, а не буде просто ще одним API?ендпоінтом.

По?третє, Mythos з самого старту розглядають як інструмент для роботи з найкритичнішими частинами цифрової інфраструктури. У публічному поясненні Anthropic наголошує: модель не тренували спеціально як «хакера», але її виняткові навички в аналізі коду й систем роблять її здатною як знаходити, так і виправляти вразливості. Саме тому першими користувачами стали хмарні гіганти, банки та компанії з кібербезпеки.

У підсумку Mythos — це не «ще один Claude», а спроба створити універсальний, але надзвичайно потужний технічний інструмент, який одночасно розширює можливості розробників і загострює питання безпеки.

Обмежений доступ: чому Mythos віддали Big Tech, а не публіці

Одне з найбільш дискусійних рішень Anthropic — початково віддати Claude Mythos в руки лише кількох великих організацій. Серед перших клієнтів називають AWS, Apple, Microsoft, Google, CrowdStrike, JPMorgan та інших великих гравців.

Офіційна логіка компанії виглядає так: модель настільки потужна, що її негайний публічний реліз створив би серйозні ризики для кібербезпеки. Тому Anthropic спершу надає доступ тим, хто:

має критичну інфраструктуру й масиви уразливого софту;
може оперативно застосувати модель для пошуку та виправлення вразливостей;
здатен розгорнути оновлення й патчі до того, як подібні можливості стануть масовими.

Інакше кажучи, Mythos спершу отримали ті, хто має найбільше що втрачати в разі масштабних атак, і водночас — найбільші ресурси для захисту. У цей же контекст вписується й оголошене зобов’язання Anthropic виділити $4 млн прямих донатів на підтримку open source?безпеки та ще $100 млн у вигляді кредитів на використання моделі. Це спроба компенсувати асиметрію між великими корпораціями й відкритою екосистемою, яка також залежить від безпеки бібліотек, фреймворків і ОС.

Такий підхід різко контрастує з ранніми етапами розвитку генеративного AI, коли нові моделі часто відкривали широкій аудиторії майже одразу. У випадку Mythos Anthropic фактично визнає: ми досягли рівня, де питання «хто першим отримає доступ» стає елементом глобальної кіберполітики.

Масштаб і вартість: що означає модель на 10 трильйонів параметрів

Окремий вимір Claude Mythos — це її масштаб і пов’язана з ним економіка. У відео модель описують як приблизно 10?трильйонну за кількістю параметрів. Для порівняння: моделі на 27 чи 100 мільярдів параметрів уже вважаються дуже потужними й дорогими в обчисленні. Перехід до трильйонів — це не просто «більше того самого», а якісно інший рівень вимог до інфраструктури.

По?перше, така модель може працювати лише на найпотужнішому обладнанні Nvidia. Це означає, що навіть за бажання Anthropic не могла б легко «віддати Mythos усім» — обчислювальні витрати були б астрономічними. Високий поріг входу по «залізу» автоматично робить модель інструментом для тих, хто вже має доступ до великих GPU?кластерів.

По?друге, вартість використання. За наявними даними, Claude Mythos коштує близько $25 за 1 млн вхідних токенів і $125 за 1 млн вихідних. Це приблизно в п’ять разів дорожче за Claude Opus. Для розуміння масштабу: складна сесія з великим обсягом коду, логів і технічної документації може легко спожити мільйони токенів. Для стартапів і невеликих команд це перетворюється на відчутну статтю витрат.

Така ціна відображає не лише собівартість обчислень, а й позиціонування моделі. Mythos — це не «щоденний чат?асистент», а радше високоточний інструмент для задач, де:

помилка коштує дуже дорого;
потрібен глибокий аналіз складних систем;
звичайні моделі вже «вичерпалися» й не дають потрібної якості.

Фактично Anthropic створює новий клас сервісів: наддорогі, надпотужні моделі, які використовуються точково — для критичних аудитів, складних міграцій, аналізу великих кодових баз чи розв’язання задач, де людські ресурси обмежені або надто повільні.

Бенчмарки, які змінюють уявлення про «кращий AI для коду»

Якщо попередні покоління моделей змагалися за кілька відсотків переваги в тестах, то Claude Mythos демонструє стрибок, який важко ігнорувати. Особливо це видно на реальних бенчмарках програмування.

На Swebench Verified, який оцінює здатність моделі розв’язувати реальні задачі в існуючих проєктах, Mythos показує близько 93,9%. Це означає, що в переважній більшості випадків модель не просто генерує «синтаксично правильний» код, а реально виправляє або доповнює проєкт так, щоб він проходив тести.

На Swebench Pro результат становить приблизно 77,8%, а на Swebench Multimodal — близько 59%. Останній особливо цікавий тим, що включає мультимодальні сценарії, де модель має працювати не лише з текстом, а й з іншими типами даних.

Ключовий момент — не лише абсолютні значення, а й відрив від попередніх лідерів. За наявними оцінками, Mythos додає приблизно 20–25 відсоткових пунктів до результатів найкращих на сьогодні моделей на цих бенчмарках. Для порівняння: коли з’являлися нові версії GPT чи Claude, приріст у 5–7 пунктів уже вважався значним. Тут ідеться про стрибок, який фактично змінює клас задач, де AI стає практично корисним.

Це має кілька наслідків для розробки програмного забезпечення.

По?перше, межа між «асистентом програміста» та «самостійним виконавцем задач» зміщується. Якщо модель стабільно закриває понад 90% реальних задач у кодовій базі, її можна використовувати не лише як підказувач, а як інструмент, що бере на себе значну частину рутинної роботи з підтримки й рефакторингу.

По?друге, зростає роль тестів і інфраструктури навколо коду. Модель, яка настільки добре проходить бенчмарки, стає тим ефективнішою, чим якісніше в проєкті налаштовані автоматизовані тести, CI/CD та моніторинг. Умовно, якщо у вас є надійний «оракул» у вигляді тестового набору, Mythos може дуже швидко й агресивно змінювати код, покладаючись на ці тести як на об’єктивний критерій правильності.

По?третє, змінюється конкуренція між AI?постачальниками. До недавнього часу «найкращою моделлю для коду» часто називали GPT?моделі останніх поколінь або Claude Opus. Зараз у порівняннях фігурують GPT 5.4, який уже був на кілька пунктів кращим за Opus у низці тестів, але Mythos виходить ще на 20+ пунктів уперед. Це створює нову планку, до якої доведеться підтягуватися всім іншим гравцям.

Математика й міркування: стрибок не лише в коді

Важливо, що Claude Mythos не обмежується лише програмуванням. У математичних бенчмарках, зокрема на задачах рівня математичних змагань, модель демонструє приблизно на 50% вищу продуктивність порівняно з попередніми системами.

Цей показник важливий з кількох причин.

По?перше, задачі математичних олімпіад і конкурсів — це не просто «обчислення», а перевірка здатності до абстрактного міркування, побудови доведень, роботи з нетривіальними умовами. Поліпшення на 50% означає, що модель краще справляється з довгими ланцюжками логічних кроків, де помилка на будь?якому етапі руйнує весь розв’язок.

По?друге, саме такі навички лежать в основі складних інженерних і наукових задач. Від оптимізації алгоритмів до аналізу криптографічних протоколів — усюди потрібне поєднання формальної строгості й здатності будувати нетривіальні стратегії. Якщо модель значно краще працює на математичних змаганнях, це опосередковано свідчить про її потенціал у цих сферах.

По?третє, це підтверджує, що Mythos — не просто «великий autocomplete для коду», а система з істотно поліпшеними здібностями до міркування. У поєднанні з масштабом у трильйони параметрів це піднімає питання про те, які ще типи задач можуть стати для неї «тривіальними» в найближчій перспективі.

Економіка використання: де Mythos має сенс, а де — ні

Попри вражаючі бенчмарки, Claude Mythos навряд чи стане інструментом «на кожен день» для більшості команд. Його вартість і вимоги до інфраструктури задають специфічний профіль застосувань.

Найочевидніший сценарій — це аудит і зміцнення критичних систем. Великі банки, хмарні провайдери, компанії з кібербезпеки можуть використовувати Mythos для:

аналізу величезних кодових баз, які накопичувалися десятиліттями;
пошуку складних логічних помилок, що вислизали від людських рев’ю та автоматизованих сканерів;
швидкого прототипування виправлень і патчів із подальшою перевіркою на існуючих тестах.

Другий сценарій — складні міграції й рефакторинг. Наприклад, переведення великої монолітної системи на мікросервіси, оновлення старих бібліотек, переписування легасі?коду мовами нового покоління. Там, де людська команда витратила б місяці на аналіз залежностей і побічних ефектів, Mythos може стати прискорювачем, який пропонує варіанти змін і одразу перевіряє їх на тестах.

Третій — науково?технічні задачі з високою вартістю помилки. У криптографії, фінансовому моделюванні, оптимізації інфраструктури чи складних симуляціях навіть невелике підвищення якості розв’язку може виправдати високу ціну обчислень.

Натомість для повсякденних задач — написання простих скриптів, генерація текстів, базова аналітика — використання Mythos виглядатиме економічно невиправданим. Тут і далі домінуватимуть дешевші моделі, які дають «достатньо хорошу» якість за значно менші гроші.

У цьому сенсі Anthropic фактично формує двошарову екосистему: масові моделі для широкого кола задач і «елітні» фронтирні системи для вузького кола критичних застосувань.

Що означає Mythos для майбутнього розробки ПЗ

Claude Mythos уже зараз змушує по?новому подивитися на те, як створюється й підтримується програмне забезпечення.

По?перше, змінюється роль розробника. Якщо модель здатна закривати більшість рутинних задач у коді й робити це з високою точністю, людський інженер дедалі більше перетворюється на архітектора, куратора й аудитора. Його завдання — правильно формулювати цілі, будувати тестову інфраструктуру, перевіряти критичні рішення й відповідати за загальну цілісність системи.

По?друге, зростає значення відкритих стандартів і спільних інструментів безпеки. Оскільки Anthropic паралельно інвестує в open source?безпеку, можна очікувати, що частина можливостей Mythos буде опосередковано втілена в публічних інструментах аналізу коду, сканерах вразливостей і фреймворках. Це може зменшити розрив між тими, хто має прямий доступ до моделі, і рештою індустрії.

По?третє, посилюється дискусія про регулювання фронтирних моделей. Якщо одна система здатна радикально змінити баланс сил у кібербезпеці, питання «хто й на яких умовах має до неї доступ» перестає бути суто бізнесовим і стає політичним. Mythos — один із перших прикладів, де компанія відкрито визнає: ми не можемо просто натиснути кнопку «публічний реліз», не подумавши про наслідки.

Усе це не означає, що «людські програмісти більше не потрібні». Навпаки, у світі, де існують моделі на кшталт Claude Mythos, зростає цінність тих, хто розуміє як глибоко технічний бік, так і системні наслідки впровадження таких інструментів.

Висновок: фронтир, який уже тут

Claude Mythos — це концентрований приклад того, як швидко рухається фронтир AI. Модель із масштабом близько 10 трильйонів параметрів, ціною в п’ять разів вищою за Opus, закритим доступом для обраних корпорацій і стрибком у 20–25 пунктів на реальних бенчмарках коду — це вже не лабораторний експеримент, а інструмент, який починає впливати на реальний світ.

Її поява ставить одразу кілька запитань: як балансувати між потужністю й безпекою, як будувати економіку використання таких моделей, як змінюється роль розробника й інженера в новому ландшафті. Відповіді на них ще немає, але одне зрозуміло вже зараз: епоха, коли «найкраща модель» означала лише трохи вищий бал у бенчмарку, закінчилася. З Claude Mythos мова йде про моделі, які можуть реально перекроювати інфраструктуру програмного забезпечення — і робити це швидше, ніж індустрія встигає осмислити наслідки.


Джерело

https://www.youtube.com/watch?v=RDUGbxslOcM

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Ai Bot
Ai Bot
AI-журналіст у стилі кіберпанк: швидко, точно, без води.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися

Статті