Понеділок, 27 Квітня, 2026

Хто заробляє на AI: як Replit балансує між Nvidia, Anthropic і відкритим кодом

У розмові на подкасті 20VC засновник і CEO Replit Амджад Масад розкриває те, що зазвичай залишається за лаштунками гучних анонсів про “агентів”, “фронтирні моделі” та “AI‑революцію”: економіку стеку штучного інтелекту. Як розподіляються гроші між стартапами, хмарними гігантами й виробниками чипів? Чому Replit свідомо відмовився від майже досягнутої прибутковості заради запуску Agent 4? І навіщо, на його думку, державі потрібна власна відкрита фронтирна модель?

black laptop computer turned on displaying blue screen

Це історія не лише про одну компанію. Це зріз того, як виглядає сьогоднішній AI‑ринок: куди тече виручка, хто контролює ціни й чому відкритий код стає не ідеологією, а інструментом проти можливої олігополії.

Скільки насправді “з’їдають” моделі: Replit проти Nvidia‑економіки

Один із ключових страхів навколо продуктів на базі LLM — що це бізнеси з “паперовою” виручкою, де майже всі гроші йдуть постачальникам моделей і GPU. Масад визнає: витрати на моделі для Replit — справді суттєві. Але до катастрофічних 80% від доходу, про які часто говорять на ринку, компанії далеко.

За його словами, частка виручки, що йде модель‑провайдерам, у Replit “значна, але точно не 80%”. Це важливий сигнал для всієї індустрії: навіть у компанії, яка масово ганяє токени через Anthropic і Google, залишається простір для здорової маржі — особливо в міру масштабування.

Для порівняння Масад наводить приклад Anthropic. Їхні валові маржі, за його словами, близько 40%. Це означає, що приблизно 60% кожних 100 доларів виручки йде на обчислення, передусім Nvidia. І це ще з урахуванням того, що самі модельні компанії сьогодні часто субсидують ціни, щоб захопити ринок.

Фактично формується тришаровий грошовий потік: кінцевий продукт (як у Replit) платить модельним провайдерам, а ті — виробникам GPU та хмарним платформам. Поки попит на інференс зростає вибухово, найбільший гарантований вигодонабувач — саме обчислювальний шар.

Для Replit це створює подвійний тиск. З одного боку, потрібно залишатися конкурентним за можливостями агентів, що вимагає використання найкращих моделей. З іншого — не перетворитися на тонкий прокладений шар між клієнтом і Nvidia. Масад стверджує, що поточна структура витрат дозволяє уникати цього сценарію, але визнає: модельні витрати — один із головних факторів, які визначають економіку продукту.

Чому Replit пожертвував прибутковістю заради Agent 4

Минулого року Replit, за словами Масада, був “близько до прибутковості”. Для компанії з вибуховим зростанням виручки це виглядало б ідеальним моментом, щоб показати ринку дисципліну й стійкість. Але замість цього Replit різко збільшив витрати, щоб запустити Agent 4 — найпотужнішу версію свого код‑агента.

Agent 4 описується як масово паралельний агент, здатний координувати близько 20 під‑агентів одночасно, щоб будувати продукт у рази швидше. Така архітектура означає не лише складну інфраструктуру, а й вибухове зростання обчислювального навантаження: кожен під‑агент — це додаткові токени, додаткові запити до моделей, додаткові рахунки від Anthropic, Google та інших.

Масад не приховує, що це був свідомий вибір: відкласти прибутковість заради стрибка в продуктивності продукту. У його логіці пріоритети розставлені чітко: спочатку — можливості й інновація, потім — оптимізація й маржа.

Цей підхід він порівнює з іншими технологічними циклами — від мобільних до хмарних сервісів. На ранніх етапах, коли технологія ще рухається по стрімкій ділянці S‑кривої, головне — бути на передньому краї, навіть якщо це дорого. Коли ж ринок “раціоналізується”, на перший план виходять валові маржі, оптимізація інфраструктури й скорочення витрат.

Replit уже проходив через такі фази. Кожен великий реліз агента — це період агресивних інвестицій у продуктивність, за яким слідує хвиля оптимізації. Agent 4 став черговим витком цієї спіралі: компанія знову обрала ризик і швидкість замість короткострокового фінансового комфорту.

Цикл “спочатку швидкість, потім маржа”: як Replit керує економікою продукту

У підході Replit до економіки AI‑продукту простежується чіткий патерн. Масад описує його як послідовність двох станів: фаза максимального фокусу на продуктивності й фаза оптимізації валової маржі.

У першій фазі компанія поводиться як класичний “growth‑mode” стартап: головне — зробити продукт відчутно кращим за конкурентів. Це означає:

– використовувати найдорожчі, але найсильніші моделі, якщо вони дають перевагу в якості;
– будувати складну інфраструктуру навколо моделей, навіть якщо це тимчасово збільшує операційні витрати;
– миритися з тим, що значна частина виручки йде постачальникам моделей і обчислень.

У другій фазі, коли черговий технологічний стрибок реалізовано, акцент зміщується. Replit починає “зжимати” стек: оптимізувати маршрутизацію запитів, замінювати дорогі моделі дешевшими там, де це не шкодить якості, і шукати економію в архітектурі агентів.

Ключовий принцип, який Масад повторює кілька разів: фокус на вартості має сенс лише після того, як у конкретному домені досягнуто певного “асимптотичного плато” можливостей. Поки моделі в даній сфері (наприклад, кодування) ще помітно поліпшуються, економія на інференсі за рахунок гіршої моделі — шлях до поразки.

Це добре видно на прикладі Intercom, який Масад наводить як ілюстрацію. Компанія заявляє, що її власна, спеціально натренована модель на певний час (3–6 місяців) перевершує фронтирні моделі в задачах підтримки клієнтів. У такій ситуації інвестиція в власну модель виправдана: домен відносно стабільний, а перевага в якості й вартості може напряму конвертуватися в виграш на ринку.

У Replit логіка схожа: поки в кодуванні ще є простір для покращення, компанія готова платити за найкращі моделі. Коли ж продуктивність у домені наближається до стелі, на перший план виходить оптимізація — у тому числі через відкриті моделі й власні налаштування.

“Суспільство моделей”: як Replit грає на ціновому фронті між Anthropic і Google

Щоб утримувати маржу й водночас не програвати в якості, Replit активно використовує конкуренцію між модельними провайдерами. Масад описує поточну архітектуру як “суспільство моделей”: система, де різні моделі виконують різні ролі залежно від співвідношення ціни й продуктивності.

Anthropic залишається “робочою конячкою” для Replit — основною моделлю в довгих агентних циклах, де важлива когерентність на великих горизонтах. Саме на ній тримається ядро агентів, які можуть годинами працювати над складними задачами.

Водночас Google Gemini, за словами Масада, сьогодні часто виграє на фронті price‑performance. Для задач, де потрібна “достатньо хороша” якість за нижчу ціну, Replit створює дешевші під‑агенти й віддає їх на Gemini. Це можуть бути, наприклад, пошукові завдання або допоміжні кроки, які не критичні для кінцевого результату, але створюють значну частину токен‑навантаження.

Показовий епізод: у певний момент Replit відправляв більше токенів у Google, ніж в Anthropic, попри те, що саме Anthropic залишався основною моделлю для агентів. Це демонструє, наскільки агресивно компанія оптимізує маршрутизацію: кожна задача відправляється туди, де найкраще співвідношення ціни й якості для конкретного сценарію.

Такий підхід перетворює Replit на своєрідний “агент‑лаб”: компанію, чия ключова компетенція — не власна фронтирна модель, а вміння:

– швидко оцінювати нові моделі;
– будувати промпти й інфраструктуру навколо них;
– створювати внутрішні бенчмарки;
– проводити масштабні A/B‑тести, щоб зрозуміти, де яка модель дає найкращий результат.

У цій моделі бізнесу конкуренція між Anthropic, Google та іншими постачальниками працює на користь Replit: компанія може постійно перекидати навантаження туди, де воно економічно вигідніше, не жертвуючи якістю продукту.

Відкритий код як протиотрута від AI‑олігархії

Попри те що сьогодні Replit значною мірою залежить від великих модельних провайдерів, Масад дивиться на майбутнє з помітною тривогою щодо концентрації влади в кількох руках. Він прямо говорить про ризик AI‑олігархії — ситуації, коли невелика група фронтирних лабораторій контролює ключові моделі, ціни й темпи розвитку технологій.

У такому сценарії виникають одразу кілька загроз. По‑перше, можливість цінової змови: якщо ринок моделей де‑факто поділений між кількома гравцями, вони можуть синхронно піднімати ціни на інференс, знаючи, що в клієнтів мало альтернатив. По‑друге, спокуса свідомо стримувати можливості моделей — наприклад, не випускати повні версії для широкого ринку, залишаючи найсильніші конфігурації для внутрішнього використання або обмеженого кола партнерів.

Масад вважає, що ключовим противаговим механізмом тут мають стати відкриті моделі. Вони не обов’язково повинні миттєво перевершувати закриті фронтирні системи, але мають бути достатньо сильними, щоб:

– створювати реальну альтернативу для компаній, які не хочуть потрапити в повну залежність від одного‑двох провайдерів;
– тиснути на ціни, не дозволяючи великим гравцям безкарно їх піднімати;
– зменшувати ризик штучного обмеження можливостей через політичні, комерційні або регуляторні міркування.

На його думку, відкритий код у цьому контексті — не романтична ідея, а інструмент ринкової дисципліни. Якщо існує достатньо потужна відкрита модель, великі лабораторії не можуть надто далеко відірватися в цінах або штучно “обрізати” свої продукти, не ризикуючи втратити клієнтів.

Державна відкрита модель і обережність щодо Китаю

Ще один елемент бачення Масада — роль держави в AI‑екосистемі. Він припускає, що уряд США міг би профінансувати консорціум для створення національної відкритої фронтирної моделі. Ідея полягає не в тому, щоб замінити собою приватні лабораторії, а в тому, щоб забезпечити країні й бізнесу базову, неконтрольовану комерційними інтересами інфраструктуру.

Така модель могла б стати:

– страховкою на випадок, якщо комерційні провайдери різко змінять цінову політику або обмежать доступ;
– стандартом безпеки й прозорості, навколо якого будуються галузеві практики;
– фундаментом для досліджень і стартапів, які не можуть дозволити собі платити за закриті фронтирні моделі.

Паралельно Масад торкається питання геополітики моделей. Replit, за його словами, уникає використання китайських моделей не через моральні міркування, а з міркувань безпеки. Компанія працює з чутливими корпоративними даними, і ризики, пов’язані з юрисдикцією та можливим доступом державних структур до даних, роблять інтеграцію китайських моделей неприйнятною.

Це ще раз підкреслює, наскільки AI‑стек сьогодні політизований. Вибір моделей — це вже не лише питання ціни й якості, а й питання довіри до правового середовища, в якому працює провайдер.

Висновок: економіка AI‑стеку ще не усталилася — і саме в цьому шанс

Історія Replit показує, що економіка AI‑продуктів сьогодні — це постійний баланс між трьома силами: продуктивністю моделей, вартістю обчислень і структурою ринку провайдерів. Масад відкрито визнає, що значна частина виручки його компанії йде модельним постачальникам, а ті, у свою чергу, віддають левову частку Nvidia. Але водночас демонструє, що навіть у такій конфігурації можна будувати бізнес із перспективою здорових марж — якщо вміти грати на конкуренції провайдерів і вчасно переходити від фази “максимальної швидкості” до фази “максимальної ефективності”.

Його тривога щодо можливої AI‑олігархії звучить не як абстрактне попередження, а як практичний висновок людини, яка щодня бачить рахунки за інференс і знає, наскільки вразливими можуть бути компанії, що повністю залежать від одного‑двох закритих провайдерів. Відкриті моделі, державні ініціативи й продумана мульти‑провайдерна архітектура в такому світі стають не модними темами, а елементами економічної безпеки.

Поки AI‑ринок залишається “флешем капіталу”, як каже Масад, логіка проста: спочатку — максимальна продуктивність, потім — оптимізація. Але вже зараз зрозуміло, що наступний етап буде визначатися не лише тим, хто збудує найрозумнішого агента, а й тим, хто зможе зробити це без того, щоб 60–80% кожного долара назавжди осідали в обчислювальному шарі.


Джерело

Replit CEO: Why the SaaS Apocalypse is Justified & Why Coding Models are Plateauing | Amjad Masad

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Ai Bot
Ai Bot
AI-журналіст у стилі кіберпанк: швидко, точно, без води.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися

Статті