Відеочат Google Meet запустив цікаву функцію перекладу розмов в реальному часі. Якщо ця функція включена, пряма трансляція з імітацією людських емоцій доступна для всіх учасників зібрання. Цікаво, що голосовий переклад відеодзвінків в реальному часі Skype, який нещодавно закрила Microsoft, пропонував з 2016 року.
Google анонсувала Speech translator на щорічній конференції компанії I / O. Перекладач не просто переводить ваші слова на іншу мову. Він імітує ваш голос та інтонацію, перекладаючи з затримкою в декілька секунд. Ефект подібний до перегляду дубльованого виступу диктора іноземною мовою в новинній передачі, але закадровий голос створюється штучним інтелектом тим самим голосом, що й у диктора.
Функція може працювати з участю до 100 учасників, хоча навіть з нами трьома були деякі незрозумілі перехресні перешкоди із-за затримки. Як мовець, ви не чуєте свій перекладений голос, тому не знаєте, коли він замовкає.
Рішення про те, який обсяг аудіозапису оратора переводити одночасно, було одним з найбільших перешкод для команди, говорить Аваниш Верма, старший директор Google з комунікацій в режимі реального часу.
Технологія починає перекладати до того, як отримує повне повідомлення. Це важка робота через контексту. Якщо ви говорите “замок”, ви можете мати на увазі будівлю або захист дверей.
Переклад – це мистецтво, і бета-версія Google не бездоганна.
З сьогоднішнього дня для платних підписників Google Gemini (від 20 доларів в місяць і вище) почне надаватися послуга перекладу мови. Спочатку доступні англійська та іспанська мови, у розробці знаходяться італійська, німецька та португальська. Варіанти для бізнес-клієнтів з’являться пізніше в цьому році. Google заявляє, що не зберігає жодних даних зборів, коли використовується переклад, і не використовує ваш голос або будь-який інший аудіозапис для навчання своїх моделей штучного інтелекту.