Microsoft повертається в центр розмови про моделі штучного інтелекту — цього разу вже не лише як партнер, а як самостійний гравець. У подкасті Mixture of Experts від IBM Technology команда фахівців з прикладного ІІ обговорює нові моделі Microsoft MAI-Thinking-1 і MAI-Image-1 та те, як компанія намагається зайняти «середній ринок»: між найдорожчими frontier‑моделями та дешевшими, але ризикованішими рішеннями.

Власні моделі Microsoft: від інфраструктури до повного стеку
На великій дев-конференції Microsoft вперше чітко заявила про власну лінійку foundation‑моделей. Два флагманські релізи — це MAI-Thinking-1 та MAI-Image-1.
MAI-Thinking-1 позиціонують як «35‑мільярдну» модель, але це не просто черговий середній за розміром LLM. Під капотом — архітектура mixture of experts (MoE): загалом це трильйон параметрів, які задіюються частково, маршрутизуючись до приблизно 35 мільярдів активних параметрів залежно від завдання. Тобто йдеться про велику MoE‑систему з багатьма «експертними» підмоделями, що вмикаються під конкретні типи запитів.
Другий реліз — MAI-Image-1, модель для генерації зображень. Її подають як окремий стовп цього ж стеку: текстова «thinking»‑модель для складних задач і образна модель для візуального контенту.
Це помітний розворот стратегії. Довгий час Microsoft зосереджувалася на інфраструктурі, маючи «доволі ексклюзивне партнерство з OpenAI», де виступала «ексклюзивним постачальником обчислювальних ресурсів». Тепер обидві сторони, як відзначають експерти, «переросли ці відносини», а Microsoft будує власний модельний ряд, який доповнює, а місцями й конкурує з моделями OpenAI, що хостяться в Azure.
Трилійон параметрів і MoE: не абсолютний frontier, але близько
Чи можна вважати MAI-Thinking-1 повноцінною frontier‑моделлю? У дискусії звучить обережна відповідь: «sort of». Тобто це не пік сучасних можливостей, але й далеко не просто «маленька» модель.
Експерти описують її як «дуже велику mixture‑of‑experts‑модель», яка стоїть «десь посередині» між найбільшими, багатотрильйонними системами та класичними середніми LLM. На низці бенчмарків вона, ймовірно, буде конкурентною, на інших — відставатиме. Але загальний рівень оцінюють як «frontend‑ish», «на калібрі open‑source‑моделей OpenAI» з відставанням приблизно на «дев’ять місяців — рік» від найсучасніших рішень.
Ключ тут не в абсолютному максимумі якості, а в поєднанні трьох параметрів: достатньої продуктивності, безпечного походження даних і нижчої вартості. Це, за формулюванням одного з учасників розмови, спроба зайняти «and‑and‑and»‑позицію: «воно повністю навчене, ми можемо досягати майже frontier‑здатності і, до речі, це може бути дешевше».
MoE‑архітектура тут працює як технологічний інструмент цієї стратегії. Активуючи лише частину експертів залежно від задачі, модель намагається поєднати високу якість на складних запитах із більш раціональним використанням обчислювальних ресурсів.
«Чисті» датасети й індемніфікація: ставка на регульовані галузі
Другий великий акцент Microsoft — це походження навчальних даних і юридичні гарантії для клієнтів. Учасники дискусії проводять паралель із зоною, де традиційно працює IBM: «безпечні» моделі з прозорими, ліцензованими датасетами й без дистиляції з інших моделей.
У випадку MAI‑лінійки наголошується, що «датасети, які використовуються для pre‑training, усі ліцензовані», а сама модель «повністю навчена» — не є похідною від іншої закритої системи. Це важливо для компаній, які працюють у галузях із високими юридичними ризиками: «право, бухгалтерія, будь‑що з історією латентності», а фактично — у всіх, оскільки «кожна індустрія зараз — латентична».
Ключова фраза: «це дає їм додаткову страховку, що їх не засудять за використання копірайченого контенту чи інформації, до якої вони не мали б доступу». На тлі судових процесів навколо навчальних датасетів це стає не просто маркетинговою тезою, а реальною умовою закупівлі для великих організацій і регульованих ринків.
Один із експертів підкреслює й етичний вимір: «ми знаємо, що люди, які генерували ці дані, були оплачені в оригіналі». Це подається як плюс не лише з погляду ризиків, а й як бажаний напрямок розвитку індустрії.
У підсумку Microsoft намагається «вклинитися в солодку точку» між двома традиційними полюсами: відкритими моделями з «чистою» лінією даних, але часто нижчою якістю, і максимально потужними, але юридично складними моделями, дистильованими з закритих frontier‑систем.
Ціна токена як фактор виживання: хто виграє середній ринок
Усі ці технічні та юридичні нюанси врешті впираються в те, що сьогодні хвилює більшість корпоративних замовників: вартість використання моделей. Формулювання в подкасті різкі: «cost is on the top of minds of a lot of enterprises», «організації просто прожигають свої бюджети на токени», аж до того, що деякі «буквально банкрутують, бо витратили забагато на токени».
На цьому тлі з’являється очікування, що поява нових великих гравців з власними моделями повинна «драйвити зниження вартості для всієї екосистеми». Більше вибору — більше конкуренції, тож «у підсумку побачимо, як ціни спускаються вниз, коли опцій стає більше».
У випадку Microsoft ситуація особлива: компанія одночасно «розробляє модель, хостить її й робить інференс». Така вертикальна інтеграція теоретично дає «деякий запас для кращої цінової економіки». Водночас експерти визнають, що наразі це радше питання до стратегії, ніж до фактів: «я був би дуже зацікавлений побачити, як Microsoft керує змінами в ціноутворенні… порівняно, скажімо, з hosted OpenAI‑моделями на Azure».
Саме тут і проходить можливий поділ ринку. На одному кінці — «тонкий шар клієнтів, для яких вартість не має значення», готових платити за «найсучасніші, state‑of‑the‑art моделі» стільки, «скільки б збанкрутувало інших». На іншому — «величезна медіана», для якої критично «хто може доставити за найнижчою ціною» при прийнятній якості й безпеці.
У цій «середній» зоні Microsoft і намагається закріпитися зі своєю «майже frontier‑здатною», але потенційно дешевшою й юридично захищенішою MAI‑лінійкою.
Модель‑роутинг і UX: як архітектура впливає на бізнес‑логіку
Нові моделі не існують у вакуумі — їхнє місце визначає не лише «суха» якість, а й те, як їх вбудовують в архітектуру продуктів. У дискусії звучать дві школи думки щодо того, як економити на LLM:
перша — завжди починати з «дешевої» моделі й ескалювати до великої тільки за потреби;
друга — відразу йти в «дорогу» модель, щоб не витрачати час людей на повторні запуски й виправлення.
Паралельно формується третій, дедалі популярніший підхід — модель‑роутинг: «певна кількість запитів і задач є низькоякісними, низькозатратними, і їм точно не потрібна frontier‑модель… їх можна закривати значно менш потужними моделями за нижчу ціну». Для цього будуються системи, які автоматично підбирають відповідну модель або їхню комбінацію під конкретний запит.
MAI-Thinking-1 органічно вписується в таку схему як «середній» шар: достатньо потужний для агентних задач, але дешевший за топові моделі. Її MoE‑архітектура фактично втілює роутинг усередині самої моделі, активуючи різні експерти «залежно від завдання».
Окремий, менш очевидний, але важливий аспект — вартість адаптації людей до нових інструментів. Один із спікерів порівнює це з філософією мови програмування Ruby: «неважливо, наскільки важкою є робота комп’ютера, якщо робота програміста проста». У світі frontier‑моделей баланс зміщується: «швидкість, з якою можна спалити токени, просто вражає», і дедалі частіше постає питання, де саме дешевше — «дати машині попрацювати чи змінювати роботу інженерів».
У підсумку, на думку учасників, перемагатиме не просто «дешева модель», а «та, яка дає найбільшу економію, при цьому вимагаючи від людини мінімальної адаптації до нового workflow».
Висновок: Microsoft шукає позицію між потужністю, безпекою й бюджетом
Якщо узагальнити дискусію навколо MAI-Thinking-1 і MAI-Image-1, Microsoft не намагається вистрілити тільки в один параметр. Нові моделі одночасно:
наближаються до frontier‑рівня завдяки трильйонній MoE‑архітектурі;
грають у довгу в юридично чутливих галузях за рахунок ліцензованих, «чистих» датасетів та індемніфікації;
прицілюються до масового корпоративного ринку, де компанії «буквально бояться збанкрутувати через токени» і шукають кращий баланс ціни й якості.
Чи вдасться Microsoft реалізувати цю «and‑and‑and»‑стратегію, багато в чому залежатиме від конкретного ціноутворення щодо моделей OpenAI в Azure і від того, наскільки переконливо компанія доведе свою перевагу в безпеці даних. Але сам факт появи такого гравця з повним вертикальним стеком — від дата-центрів до власних моделей — уже змінює розклад сил на ринку й посилює тиск на всіх інших постачальників LLM переглядати ціну кожного токена.
Джерело
Mixture of Experts — Microsoft’s new AI models & bots dominate the internet


