Онлайн‑сервіси для розробників дедалі частіше працюють не з одним, а з цілою екосистемою великих мовних моделей. У розмові на подкасті 20VC with Harry Stebbings представник Replit окреслив підхід компанії до вибору й комбінування моделей — від Anthropic до Google Gemini — та пояснив, чому майбутнє бачить як «суспільство моделей», а не монокультуру одного провайдера.
![]()
Anthropic як «робоча конячка», але не єдина
Упродовж понад року моделі Anthropic залишаються основою головного агентного циклу Replit. Їхня ключова перевага — здатність довго підтримувати зв’язний контекст і працювати стабільно в тривалих сесіях. Це важливо для сценаріїв, де AI супроводжує користувача впродовж усього процесу розробки: від генерації коду до рефакторингу та налагодження.
Водночас цей «ядровий» агент — лише один елемент більшої системи. Replit не обмежується одним постачальником і не намагається «натягнути» одну модель на всі задачі. Навпаки, архітектура сервісу передбачає розподіл завдань між різними моделями залежно від їхніх сильних сторін.
Gemini і критерій «ціна–якість»
Окремий акцент — на моделях Google Gemini. Вони описуються як найкращі з точки зору співвідношення ціни та продуктивності. Фактично йдеться про позицію на «парето‑фронті»: за певної вартості токена Gemini дає таку якість, яку важко перевершити конкурентам у тому ж ціновому діапазоні.
Це особливо помітно в спеціалізованих задачах, наприклад:
- court search (пошук по судових або подібних корпусах даних)
- інші підзадачі, де не потрібна максимальна «розумність», але важлива економічність
У таких випадках Replit створює окремі субагенти, які працюють на дешевших моделях із «достатньо хорошою» якістю. Це дозволяє розвантажити основний агентний цикл на Anthropic і знизити загальну вартість обчислень.
Показовий момент: у певний період Replit надсилав більше токенів до Google, ніж до Anthropic, попри те, що Anthropic залишався базовим «робочим» агентом. Це підкреслює, наскільки важливою стала оптимізація під конкретні задачі, а не лояльність до одного вендора.
«Суспільство моделей» і поява agent labs
Ще у 2022 році в Replit сформулювали концепцію, яку назвали «суспільство моделей» (society of models). Її суть:
- використовувати моделі від усіх основних провайдерів;
- підбирати модель під конкретну задачу, а не навпаки;
- за потреби будувати власні моделі, якщо готові рішення не закривають вимоги.
На цьому тлі з’являється нове поняття — agent labs. Якщо AI‑лаби традиційно асоціюються з розробкою самих моделей, то agent labs фокусуються на іншому рівні: вони будують системи агентів, які вміють:
- комбінувати різні моделі;
- розподіляти між ними роботу;
- орієнтуватися насамперед на користувацьку проблему, а не на конкретну технологію.
До таких компаній, окрім Replit, зараховують, наприклад, Cursor та інших гравців, які створюють «розумні» середовища розробки на базі LLM‑агентів.
Від задачі до технології, а не навпаки
Ключовий принцип цього підходу — рухатися від проблеми користувача до вибору технології, а не навпаки. Логіка виглядає так:
- Спочатку формулюється конкретна задача: що саме потрібно автоматизувати, спростити або побудувати для розробника.
- Далі визначаються вимоги до системи: довжина контексту, стабільність, швидкість, вартість, точність.
- Уже потім обирається модель або комбінація моделей, які найкраще відповідають цим вимогам.
- Якщо жодна з доступних моделей не підходить, розглядається варіант створення власної.
У результаті формується багаторівнева система, де:
- довгі, складні сесії обробляє стійкий «ядровий» агент;
- вузькі або масові задачі віддаються дешевшим субагентам;
- провайдери моделей можуть змінюватися залежно від їхньої позиції на «фронті» ціна–якість.
Для індустрії це сигнал: майбутнє AI‑сервісів для розробників — не в ексклюзивній інтеграції з одним вендором, а в гнучких архітектурах, які поводяться радше як операційні системи для «суспільства моделей».


