Инструмент Genie 2 от Google может генерировать трехмерные игровые миры на лету. Хотите киберпанк-вестерн? Симулятор парусного спорта? Genie 2 создаст его. Все, что нужно для получения такого игрового мира – это простая текстовая подсказка.
Genie 2 от Google является эволюцией Generative Interactive Environments, использующей ИИ для создания новых интерактивных цифровых сред на лету. Genie 1, который выпустил Google в феврале, может создавать 2D-среды. Теперь Genie 2 переносит это в 3D-пространство.
Google называет Genie 2 моделью мира, что означает, что он может имитировать виртуальные миры с анимацией, физикой и взаимодействием объектов. Это двухэтапный процесс: Genie 2 требует быстрого изображения для экстраполяции на свет, но это изображение может быть само создано с помощью обычной текстовой подсказки.
В мире игрок – ИИ или человек – может взаимодействовать с окружающей средой. Демонстрация Google показала традиционную настройку управления WASD с альтернативными клавишами со стрелками.
Однако Genie 2 имеет ту же проблему, что и все искусственные интеллекты сегодня – потеря последовательности после определенного времени, после чего начинает генерировать что-то, что не связано с начальным запросом. Искусственный Genie 2 теряет согласованность спустя короткое время, обычно примерно через 20 секунд. Самая длинная модель, созданная Google, длилась минуту.
Частично это может быть потому, что модель Genie 2 может генерировать контрфактические или разные пути и действия, которые игрок может выбрать из фиксированной начальной точки – например, поворот влево или вправо на развилке дорог. Модель должна учитывать длинный горизонт или происходящее, когда игрок удаляется от сцены, а затем возвращается к ней снова.
В Google заявили, что Genie 2 может использовать разные точки зрения, такие как изометрический вид, видео вождения от третьего лица или перспектива от первого лица. Учитывается влияние воды, а также сложное взаимодействие с окружающей средой.
В одной демонстрации игрок смог разрезать лопнувший воздушный шарик. Дым, гравитация и отображение моделируются, но Google не сообщает, до какой степени или разрешения отображаются его модели, сколько многоугольников исчисляется на кадр.
Среды Genie 2 предназначены не только для людей. ШИ-игрок также можно моделировать как NPC или как персонажа игрока. Google продемонстрировал, как искусственному интеллекту можно сказать пройти через определенную дверь с помощью текстовой подсказки, и как искусственный интеллект может распознать команду, понять, что она означает в воспроизведенной среде, а затем продолжить.
Google не разглашает, какие вычислительные ресурсы нужны Genie 2, будет ли он выпущен публично и даже планируется ли коммерциализировать его. Но поскольку искусственный интеллект медленно проникает в игры с помощью диалогов, сгенерированных искусственным интеллектом, игры, смоделированные искусственным интеллектом, тоже могут стать реальными.