Воскресенье, 8 декабря, 2024

Наушники с ИИ создают «звуковой пузырь» регулируемого размера

Исследователи создали прототип наушников, обеспечивающих звуковой пузырь. Пользователь может настроить размер этого пузырька от 1 до 2 метров. Голоса и звуки вне пузырька заглушаются в среднем на 49 децибелов, даже если они громче, чем в пузырьке.

Алгоритмы искусственного интеллекта в сочетании с прототипом наушников из Вашингтонского университета позволяют пользователю четко слышать людей, говорящих в пузыре. Команда опубликовала свои выводы 14 ноября в Nature Electronics. Программный код устройства для подтверждения концепции доступен другим. Исследователи создают стартап для коммерциализации этой технологии.

«Люди плохо воспринимают расстояния с помощью звука, особенно когда вокруг них есть несколько источников звука», — сказал старший автор Шям Холакота, профессор в Школе компьютерных наук и инженерии Пола Г. Алена. «Наша способность сосредотачиваться на находящихся поблизости людях может быть ограничена в таких местах, как громкие рестораны, поэтому создание звуковых пузырьков на звуковом устройстве пока невозможно. Наша система искусственного интеллекта может фактически определить расстояние до каждого источника звука в комнате, и обрабатывать это в реальном времени, в течение 8 миллисекунд, на самом слуховом аппарате».

Исследователи создали прототип с коммерчески доступными наушниками с шумопоглощением. Они прикрепили шесть маленьких микрофонов поперек повязки. Нейронная сеть, работающая на небольшом встроенном компьютере, подключенном к наушникам, отслеживает, когда разные звуки достигают каждого микрофона. Затем система подавляет звуки, поступающие извне пузыря, одновременно воспроизводя и немного усиливая звуки внутри пузырька (поскольку наушники с шумоподавлением физически пропускают определенный звук).

Чтобы научить систему создавать звуковые пузырьки в разных средах, исследователям понадобился набор звуковых данных на основе расстояния, собранный в реальном мире, который был недоступен. Чтобы собрать такой набор данных, они надевают наушники на голову манекена. Роботизированная платформа вращала голову, а подвижный динамик воспроизводил звуки, доносившиеся с разных расстояний. Команда собрала данные с помощью системы манекенов, а также с пользователями в 22 разных помещениях, включая офисы и жилые помещения.

Исследователи определили, что система работает по нескольким причинам. Во-первых, глава пользователя отражает звуки, что помогает нейронной сети различать звуки с разных расстояний. Во-вторых, звуки (как человеческая речь) имеют несколько частот, каждая из которых проходит разные фазы, когда она уходит от источника. Исследователи говорят, что алгоритм ИИ сравнивает фазы каждой из этих частот, чтобы определить расстояние до любого источника звука (например, говорящего человека).

Такие наушники, как AirPods Pro 2 от Apple, могут усиливать голос находящегося перед пользователем, одновременно уменьшая фоновый шум. Но эти функции работают, отслеживая положение головы и усиливая звук, поступающий с определенного направления, а не измерение расстояния. Это означает, что наушники не могут усиливать несколько источников одновременно, теряют функциональность, если пользователь отворачивает голову от целевого источника и не столь эффективно уменьшают громкие звуки со стороны источника.

Систему обучено работать только в помещении, потому что получить чистое обучающее звучание сложнее на улице. Далее команда работает над тем, чтобы технология работала на слуховых аппаратах и ??наушниках с шумопоглощением, что требует новой стратегии расположения микрофонов.

 

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Євген
Євген
Евгений пишет для TechToday с 2012 года. По образованию инженер,. Увлекается реставрацией старых автомобилей.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися