Четвер, 4 Липня, 2024

Шумопоглинальні навушники зі штучним інтелектом дозволяють зосередитися лише на одному голосі

Прототип навушників із шумопоглинанням дозволяє вибрати, які фонові шуми заглушити, дозволяючи привернути «аудіопрожектор» до певного голосу, щоб ви могли зосередитися на ньому.

Звичайні навушники із системою шумопоглинання зменшують небажані звуки, такі як гуркіт двигуна автобуса, але оскільки технологія повністю скасовує певні частоти, вона також може пригнічувати звуки, які ми хочемо почути.

Тепер Шям Голлакота з Університету Вашингтона в Сіетлі та його колеги створили навушники, які можуть усувати будь-які небажані шуми, залишаючи інші без змін, незалежно від їх звукової частоти. Його також можна навчити натисканням кнопки, щоб визначити голос конкретної людини та виключити всі інші шуми.

Дослідники представили свій прототип на спільній зустрічі Акустичного товариства Америки та Канадської акустичної асоціації. Пристрій використовує систему штучного інтелекту, яка була навчена на багатьох прикладах 20 різних типів звуків, включаючи будильники, плач немовлят і спів птахів. Користувач може ввімкнути або вимкнути кожну категорію звуку з додатка, дозволяючи йому проходити через навушники або бути заблокованим.

Прототип складається з комерційно доступних навушників із мікрофоном, прикріпленим із зовнішнього боку корпусу, який закриває кожне вухо. Ці мікрофони записують навколишній звук і передають його або на маленький мікроконтролер Orange Pi, або на смартфон, на якому працює нейронна мережа. Потім цей ШІ видаляє непотрібні звуки та передає відредагований аудіопотік у навушники. Голлакота каже, що це обладнання може бути вбудоване в комплект навушників.

Технологія працює так само, як штучний інтелект, який використовувався для виділення окремих інструментів і голосів серед галасливого безладдя, записаного під час роботи над альбомом The Beatles 1970 року Let It Be , що дозволило режисеру Пітеру Джексону створити документальний серіал The Beatles: Get Back .

Цей процес зайняв деякий час, але цей прототип може обробляти аудіо лише за 8 мілісекунд, оскільки команда зберегла нейронну мережу достатньо малою та простою для швидкої роботи мобільного пристрою, щоб уникнути затримок між подіями, що відбуваються, і тим, що ви їх чуєте.

Голлакота каже, що ефект схожий на «аудіопрожектор», який звертається на джерело шуму, що дозволяє зосередитися на ньому навіть у хаотичному та гучному середовищі.

«Це має нові можливості, які дають користувачеві більше контролю. Прямо зараз ми робимо перші кроки щодо покращення звукового сприйняття людини», — каже Голлакота.

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я

Євген
Євген
Євген пише для TechToday з 2012 року. Інженер за освітою. Захоплюється реставрацією старих автомобілів.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися