У міру того як ШІ починає взаємодіяти з фізичним світом, з’являються нові лабораторії, що будують так звані світові моделі — їх можна використовувати для керування роботами або моделювання об’єктів у фізичному просторі. На відміну від великих мовних моделей, для таких систем немає простого та очевидного джерела даних, тому багато лабораторій сьогодні лихоманково збирають необхідні навчальні набори.

Новий стартап пропонує несподіване джерело таких даних — індустрію відеоігор.
Це концепція Origin Lab, яка щойно оголосила про сид-раунд у розмірі $8 млн під проводом Lightspeed Ventures. У раунді також взяли участь SV Angel, Eniac, Seven Stars і FPV, а серед бізнес-ангелів — співзасновник Twitch Кевін Лін та засновник Cruise Кайл Вогт.
“Системам ШІ, які зараз створюються, потрібно розуміти, як працює фізичний світ і як рухаються речі”, — розповіла TechCrunch співгендиректорка та співзасновниця Origin Lab Анн-Марго Родд. — “Ці дані по суті живуть у відеоіграх”. Інші співзасновники компанії (на фото вище) — Антуан Гарго та Колін Каррієр.
У спрощеному вигляді Origin Lab стане маркетплейсом, де лабораторії, що розробляють світові моделі — на кшталт AMI Labs Яна ЛеКуна чи World Labs Фей-Фей Лі — зможуть купувати якісні ліцензовані дані. З іншого боку, компанії-розробники ігор зможуть отримувати додатковий дохід з уже створених цифрових активів. Посередником виступатиме Origin Lab, яка перетворюватиме ігрові активи у формат, придатний для навчальних даних — це може бути як простий рендеринг, так і автоматизація годин відеопроходжень.
“Стало очевидно, що ігрова індустрія сидить на неймовірно цінних даних, але не існувало реального способу чи інфраструктури, щоб з’єднати ШІ-лабораторії та індустрію відеоігор”, — каже Родд. — “Тож по суті ми побудували цей міст”.
Лабораторії вже давно цікавляться відеоігровим відео як джерелом даних, але проблеми з ліцензуванням та якістю даних часто ставали на заваді. У грудні 2024 року OpenAI спричинила невеликий скандал, коли перша версія її моделі генерації відео Sora, схоже, відтворювала фрагменти популярних відеоігор і стрімерів — імовірно тому, що модель навчали на стрімах Twitch. Amazon відкрито заявляла про інтерес до використання контенту Twitch для навчання своїх моделей.
Успішний раунд Origin є ознакою зростання ринку не лише навчальних даних, а й стартапів, які стають критично важливими постачальниками для великих ШІ-лабораторій. Партнер Lightspeed Фараз Фатемі, який очолив інвестицію в Origin, каже, що успіх компаній на кшталт Scale AI зробив цю можливість надто очевидною, щоб її ігнорувати.
“Ми бачили, наскільки стрімко може зростати виручка в постачальників даних, які працюють з великими лабораторіями”, — сказав Фатемі в коментарі TechCrunch. — “Це дуже добре капіталізовані бізнеси, і для всіх них вузьким місцем є дані”.


