Программисты Google создали решение для еще большей экономии пропускной способности интернет-канала при голосовых звонках. Это должно позволить использование звонков через интернет-мессенджеры еще одному миллиарду пользователей. Однако у технологии есть компромисс: пользователи будут слышать не совсем то, что говорят.
Google Lyra – это новый аудиокодек, который использует технологии машинного обучения для повышения качества разговоров и сбережения пропускной способности интернет-каналов. Google сделал его с открытым исходным кодом и приглашает других использовать его в своих коммуникационных приложениях. Lyra работает на 64-битной ARM-платформе Android и Linux.
Особенность Lyra в том, что этот кодек не пересылает непосредственно звук. Он пересылает информацию, которую на принимающей стороне должна расшифровать генеративная модель. Фактически декодер будет пытаться угадать, что именно ему прислали.
Подобный подход к сбережению трафика ранее предложила NVIDIA с технологией Maxine. Она превращает видеозвонок двух человек в коммуникацию искусственных интеллектов, а пользователи видят не реального собеседника, а выдуманного нейросетью. Ведь пересылается только описание лицо юзера перед камерой, а принимающая сторона пытается воспроизвести по такому описанию изображение. Технология позволяет сэкономить количество трафика в 10 раз, и для этого также используются генеративные нейросети.
Разработчики Lyra открыли этот аудеокодек для других программистов на этой неделе.