Неділя, 22 Грудня, 2024

У голосових дзвінках скоро можемо почати чути не те, що кажуть – нова технологія Google Lyra

Програмісти Google створили рішення для ще більшого заощадження пропускної здатності інтернет-каналу при голосових дзвінках. Це має дозволити використання дзвінків через інтернет-месенджери ще одному мільярду юзерів. Однак у технології є компроміс: користувачі чутимуть не зовсім те, що кажуть.

Google Lyra – це новий аудіокодек, який використовує технології машинного навчання для підвищення якості розмов та заощадження пропускної здатності інтернет-каналів. Google зробив його з відкритим вихідним кодом та запрошує інших використовувати його в своїх комунікаційних додатках. Lyra працює на 64-бітній ARM-платформі Android та Linux.

Особливість Lyra в тому, що цей аудіокодек не пересилає безпосередньо звук. Він пересилає інформацію, яку на стороні, що приймає, має розшифрувати генеративна модель. Фактично декодер буде намагатися вгадати, що саме йому прислали.

Подібний підхід до заощадження трафіку раніше запропонувала NVIDIA з технологією Maxine. Вона перетворює відеодзвінок двох людей на комунікацію штучних інтелектів, а користувачі бачать не реального співрозмовника, а вигаданого нейромережею. Адже пересилається лише опис обличчя юзера перед камерою, а сторона, яка приймає, намагається відтворити за таким описом зображення. Технологія дозволяє заощадити кількість трафіку до 10 разів, і для цього також використовуються генеративні нейромережі.

Розробники Lyra відкрили цей аудеокодек для інших програмістів цього тижня.

Євген
Євген
Євген пише для TechToday з 2012 року. Інженер за освітою. Захоплюється реставрацією старих автомобілів.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися