У голосових дзвінках скоро можемо почати чути не те, що кажуть – нова технологія Google Lyra

Google Lyra – це новий аудіокодек, який використовує технології машинного навчання для підвищення якості розмов

Програмісти Google створили рішення для ще більшого заощадження пропускної здатності інтернет-каналу при голосових дзвінках. Це має дозволити використання дзвінків через інтернет-месенджери ще одному мільярду юзерів. Однак у технології є компроміс: користувачі чутимуть не зовсім те, що кажуть.

Google Lyra – це новий аудіокодек, який використовує технології машинного навчання для підвищення якості розмов та заощадження пропускної здатності інтернет-каналів. Google зробив його з відкритим вихідним кодом та запрошує інших використовувати його в своїх комунікаційних додатках. Lyra працює на 64-бітній ARM-платформі Android та Linux.

Особливість Lyra в тому, що цей аудіокодек не пересилає безпосередньо звук. Він пересилає інформацію, яку на стороні, що приймає, має розшифрувати генеративна модель. Фактично декодер буде намагатися вгадати, що саме йому прислали.

Подібний підхід до заощадження трафіку раніше запропонувала NVIDIA з технологією Maxine. Вона перетворює відеодзвінок двох людей на комунікацію штучних інтелектів, а користувачі бачать не реального співрозмовника, а вигаданого нейромережею. Адже пересилається лише опис обличчя юзера перед камерою, а сторона, яка приймає, намагається відтворити за таким описом зображення. Технологія дозволяє заощадити кількість трафіку до 10 разів, і для цього також використовуються генеративні нейромережі.

Розробники Lyra відкрили цей аудеокодек для інших програмістів цього тижня.

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я