На каналі Tech With Tim вийшов великий розбір MiniMax M3 — нової моделі від китайської AI-лабораторії MiniMax, орієнтованої на кодування, довгі сесії та інтенсивне використання інструментів у стилі агентів. Ключовий акцент — не стільки на абсолютній якості моделі, скільки на співвідношенні “можливості / ціна” та тих сценаріях, де це співвідношення кардинально змінює вибір інструменту для розробника.
![]()
Відкрита китайська лабораторія й філософія “все викладаємо”
MiniMax позиціонується як китайська дослідницька лабораторія, яка за короткий час випустила багато моделей і тримає чіткий курс на відкритість. Усі ваги моделей публікуються: їх можна завантажувати, запускати локально, тонко налаштовувати й експериментувати з ними без прив’язки до закритого хмарного API.
Це різко контрастує з підходом великих західних гравців на кшталт Anthropic чи розробників GPT, де доступ до моделей йде виключно через закриті API, а ваги не роздаються. У практичному вимірі для розробника це означає можливість:
- розгортати MiniMax M3 на власній інфраструктурі;
- будувати кастомні рішення поверх базових ваг;
- тестувати різні архітектурні підходи без очікування офіційних релізів.
У контексті інструмента для кодування це важливо не лише з точки зору контролю над даними, а й з точки зору вартості: локальний або гібридний запуск відкритих ваг дозволяє ще більше зменшувати витрати в порівнянні з використанням “чистого” хмарного API.
Мільйон токенів контексту й автономні довгі ран-и
Одна з найбільш помітних характеристик MiniMax M3 — гігантське контекстне вікно. Максимальний розмір сягає 1 мільйона токенів, причому гарантовано доступно щонайменше 512 000 токенів незалежно від режиму використання.
Механіка тут гнучка: залежно від того, що саме робить модель, робоче контекстне вікно може трохи “стискатися”, але нижня межа у 512 тисяч токенів залишається. Для більшості розробницьких сценаріїв це означає практично відсутні обмеження на довжину сесії: довгі логи інструментальних викликів, великі обговорення архітектури, багатократні ітерації над однією й тією ж кодовою базою без постійного “обрізання” історії.
У демонстрації від MiniMax модель запускали повністю автономно протягом 12 годин. Вона безперервно виконувала інструментальні виклики, оновлювала стан і продовжувала роботу без втручання людини, перш ніж зрештою “здатися”. Цей приклад показує, що величезне контекстне вікно не просто задеклароване на папері, а реально використовується у довгих, насичених сесіях із частим зверненням до інструментів.
У реальній роботі з кодом це відкриває можливість тримати в одному ланцюжку історію з десятків чи сотень кроків: від первинної постановки задачі до складних рефакторингів і системних змін без примусового “ресету” агента.
Мультимодальність із нуля, а не “прикручена збоку”
MiniMax M3 — нативно мультимодальна модель. Вона вміє працювати з текстом, зображеннями, відео, а також виконувати генерацію цих модальностей. Ключовий момент: мультимодальність тут не “доліплена” поверх уже готової текстової моделі, а врахована з самого початку тренування.
Модель навчали одразу з урахуванням задач генерації зображень і відео, а не додавали ці можливості як окремий шар чи додатковий модуль потім. Це важливе уточнення для розробників, які планують будувати інструменти, де текстові та візуальні компоненти тісно пов’язані: наприклад, сценарії, де одна й та сама сесія включає аналіз коду, генерацію діаграм, візуалізацію інтерфейсів або пояснювальні відео.
У цьому огляді акцент робився насамперед на кодуванні, але факт первинної мультимодальності задає вектор: MiniMax M3 проектували як універсальний рушій, здатний працювати з кількома типами даних без “латок” поверх текстової основи.
Ціна, яка радикально змінює поведінку розробника
Ключовий аргумент на користь MiniMax M3 — його вартість у порівнянні з флагманськими моделями на кшталт Opus та різних варіантів Claude.
За 20 доларів на місяць у MiniMax можна отримати приблизно 1,7 мільярда токенів. Для порівняння, в екосистемі Claude ці ж 20 доларів дають зовсім інші обсяги:
- близько 11,1 мільйона токенів у тарифі Claude Haiku;
- близько 3,7 мільйона токенів у Claude Sonnet 4.6;
- близько 2,2 мільйона токенів у Opus 4.8.
Якщо приводити це до множника, виходить, що за однакові 20 доларів MiniMax M3 дає приблизно у 765 разів більше токенів, ніж Opus 4.8. Навіть з урахуванням інших типів підписок у Claude різниця у відчутті “скільки можна собі дозволити” — колосальна.
Це напряму впливає на стиль роботи розробника:
- зникає страх зайвий раз перезапустити довгу сесію;
- стає нормальною практика “перестрахуватися” й дозволяти моделі робити більше кроків, більше аналізу, більше валідації;
- можна спокійніше віддавати моделі великі обсяги коду чи документації, не підраховуючи кожен запит.
У тестах при активному використанні MiniMax M3 ліміти часу роботи плану залишалися майже не зачепленими, що тільки підкреслює запас міцності цієї економічної моделі. При відносно невеликій абонплаті її можна буквально “крутити на максимум”, не оглядаючись на лічильник.
Не найкраща модель, але вкрай вигідна
У технічному плані MiniMax M3 — дуже сильна модель, особливо для кодування, але не абсолютний чемпіон. Прямо зазначається: це не найкраща модель, що існує зараз. У багатьох задачах Opus 4.8 і подібні флагмани все ще показують кращу якість.
Проте саме співвідношення якості до вартості робить MiniMax M3 унікальним інструментом. Модель демонструє:
- впевнені результати у складних задачах кодування;
- хорошу здатність до виклику інструментів;
- високу користь у довгих сесіях за рахунок великого контексту.
Йдеться саме про “достатньо хорошу” якість, помножену на майже абсурдно низьку вартість кожного токена. У підсумку для переважної більшості щоденних задач — понад дев’ять із десяти — логічніше використати MiniMax M3, ніж витрачати дорогі виклики Opus чи інших топових моделей, які на практиці дадуть лише помірно кращий результат за кратно вищу ціну.
У демонстраціях MiniMax M3 не був найшвидшим у порівнянні з іншими моделями: часто він витрачав більше часу, робив більше кроків, детальніше аналізував код. Але за умов, коли токени дешеві, а контекст величезний, це стає не недоліком, а частиною дизайну: модель може дозволити собі “думати довше”, перевіряти більше, виправляти себе й проходити кілька ітерацій, не змушуючи користувача рахувати кожну хвилину чи кожну тисячу токенів.
Висновок: модель для тих, хто хоче “лупити по максимуму” без страху за рахунок
MiniMax M3 виявляється не просто ще однією LLM-моделлю в перенасиченому полі, а інструментом із дуже конкретним профілем: відкриті ваги, величезний контекст, вбудована мультимодальність і радикально низька вартість токенів.
У порівнянні з Opus та різними варіантами Claude він поступається у піковій якості, але перемагає там, де для розробника важливіше інше: можливість запускати довгі агентні сесії, масово ганяти інструментальні виклики й підключати модель до щоденного робочого циклу так, щоб вартість не ставала обмеженням.
Для команд і окремих розробників, які шукають баланс між “достатньою” якістю коду й агресивною економією бюджету, MiniMax M3 виглядає одним із найцікавіших рішень на ринку.


