ChatGPT, ставший приложением с наиболее быстрым ростом базы пользователей за всю историю, может снова попасть на первые полосы новостных изданий. Microsoft собирается обновить инструмент искусственного интеллекта, запустив модель искусственного интеллекта GPT-4. Если текущая GPT-3 способна генерировать текст, следующая GPT-4 будет генерировать видео по текстовым подсказкам.
Эту новость обнародовал Андреас Браун, главный технический директор Microsoft Германия, на недавнем мероприятии под названием «Искусственный интеллект в фокусе – цифровой старт». По словам Брауна, «мы представим GPT-4… у нас будут мультимодальные модели, которые будут предлагать совсем другие возможности – например видео».
GPT – это искусственный интеллект, лежащий в основе сервиса ChatGPT. ChatGPT может отвечать только в текстовой форме.
ChatGPT не будет первым инструментом на основе искусственного интеллекта для создания видео. В 2022 году владелец Facebook (Meta) запустил инструент Make-A-Video, создающий реалистичные видео на основе коротких текстовых подсказок. Судя по этому, следующая версия ChatGPT может совершить нечто подобное.
На мероприятии представители Microsoft объяснили, что GPT-4 будет «мультимодальным». Хольгер Кенн, директор по бизнес-стратегии Microsoft Германия, рассказал, что это позволит искусственному интеллекту превращать текстовую подсказку пользователя в изображения, музыку и видео.
Microsoft привела пример того, как колл-центр может использовать GPT-4 для автоматического преобразования телефонных разговоров между сотрудниками и клиентами в текст, что сэкономит огромное количество времени и усилий, которые раньше тратились на суммирование этих звонков после их завершения.