Інструмент Genie 2 від Google може генерувати тривимірні ігрові світи, на льоту. Хочете кіберпанк-вестерн? Симулятор вітрильного спорту? Genie 2 створить його. Все, що потрібно для отримання такого ігрового світу – це проста текстова підказка.
Genie 2 від Google є еволюцією Generative Interactive Environments, яка використовує ШІ для створення нових інтерактивних цифрових середовищ на льоту. Genie 1, який Google випустив у лютому, може створювати 2D-середовища. Тепер Genie 2 переносить це в 3D-простір.
Google називає Genie 2 «моделлю світу», що означає, що він може імітувати віртуальні світи з анімацією, фізикою та взаємодією об’єктів. Це двоетапний процес: для Genie 2 потрібне швидке зображення для екстраполяції на світ, але це зображення може бути само створене за допомогою звичайної текстової підказки.
У світі гравець — ШІ або людина — може взаємодіяти з навколишнім середовищем. Демонстрація Google показала традиційне налаштування управління WASD із альтернативними клавішами зі стрілками.
Однак Genie 2 має ту ж проблему, що й усі штучні інтелекти сьогодні – втрату послідовності після певного часу, після чого починає генерувати щось, що не зв’язане з початковим запитом. Штучний Genie 2 втрачає узгодженість через короткий час, зазвичай приблизно через 20 секунд. Найдовша модель, створена Google, тривала хвилину.
Частково це може бути тому, що модель Genie 2 може генерувати контрфактичні або різні шляхи та дії, які гравець може вибрати з фіксованої початкової точки — наприклад, поворот ліворуч або праворуч на розвилці доріг. Модель має враховувати довгий горизонт або те, що відбувається, коли гравець віддаляється від сцени, а потім повертається до неї знову.
У Google заявили, що Genie 2 може використовувати різні точки зору, такі як ізометричний вигляд, відео водіння від третьої особи або перспектива від першої особи. Враховується вплив води, а також складна взаємодія з навколишнім середовищем.
В одній демонстрації гравець зміг розрізати повітряну кульку, яка лопнула. Дим, гравітація та відображення моделюються, але Google не повідомляє, до якого ступеня чи роздільної здатності відображаються його моделі, чи скільки багатокутників обчислюється на кадр.
Середовища Genie 2 призначені не лише для людей. ШІ-гравців також можна моделювати як NPC або як персонажа гравця. Google продемонстрував, як штучному інтелекту можна сказати пройти через певні двері за допомогою текстової підказки, і як штучний інтелект може розпізнати команду, зрозуміти, що вона означає у відтвореному середовищі, а потім продовжити.
Google не розголошує, які обчислювальні ресурси потрібні Genie 2, чи буде він випущений публічно, і навіть чи планується комерціалізувати його. Але оскільки штучний інтелект повільно проникає в ігри за допомогою діалогів, згенерованих штучним інтелектом, ігри, змодельовані штучним інтелектом, зрештою теж можуть стати реальними.