Понеділок, 30 Грудня, 2024

Віддати голос іншому: тембр на благодійність

У світі нараховується близько 2,5 млн людей, які з різних причин втратили можливість розмовляти власним голосом, і за них це робить комп’ютер. Електронний голос звучить постійно однаково, і таких пацієнтів не відрізнити на слух. Однак скоро це може змінитися, адже у світі з’явився банк голосу, куди можна пожертвувати і свій.

Один з найпопулярніших фізиків – Стівен Хокінг – відомий також своєю системою комунікації. Літери вимовляє комп’ютер, і цей голос став іконою, а сам науковець вже вважає його своїм. Він користується однією системою комунікації вже понад 20 років, але його хвороба продовжує прогресувати, і поточне рішення вже не справляється. І коли у Intel почали роботу над новою, поліпшеною, версією системи, у Хокінга була лише одна вимога – залишити його голос без змін.

«Цей голос став таким відомим, що він вважає його персональним голосом, – розповідає Хорст Хоссекер. Він працює керівником проекту оновлення комунікаційної системи та займає посаду директора лабораторії Intel Computational Imaging Lab. – Він заснований на застарілій технології, але це робить його унікальним і його неможливо скопіювати, навіть якщо захотіти».

Голосова система Стівена Хокінга – одне з найвідоміших подібних рішень

Ідея банку голосу

Незважаючи на те, що люди втрачають здатність розмовляти, вони все одно хочуть демонструвати свою природну індивідуальність навіть при спілкуванні через комп’ютер. Дослідниця Рупал Пател у 2002 році з’ясувала, що для цього вони змінюють тембр та висоту комп’ютерного голосу так, щоб він був максимально схожий на їхній власний. Проте це не допомагало, і розрізнити особистість користувача на слух було неможливо.

«Я склала два плюс два, – згадує вона, – Я подумала, що якщо в них є ця частина голосу, тоді можна збудувати для них персональне звучання».

Ця ідея залишилася, і в наступні роки Пател розвивала свої технології. У 2007 році вона започаткувала свою компанію VocaliD, мета якої – створювати персональний голос для комп’ютерних систем мовлення, які використовують німі люди. Для цього вона змішує звуки, що видають пацієнти, із записами слів від здорових донорів. Ця послуга платна, а ціна фінального «голосу» залежить від початкових вимог.

Створювати індивідуальний голос спеціалістам VocaliD вдається завдяки тому, що звучання людини складається з двох компонентів. Голосові зв’язки генерують звук, а індивідуальності йому додає фільтр – шлях, по якому проходить повітря всередині тіла. Різноманітні травми впливають якраз на останній, а ось голосові зв’язки залишаються робочими.

Завдання експертів VocaliD – знайти такого донора, який має схожий фільтр, та за допомогою сучасних технологій накласти його на звуки, які видає пацієнт. Стати донором такого банку голосу може кожен – для цього потрібний комп’ютер, мікрофон та декілька годин для запису сотень підготовлених речень. Поки що компанія працює лише з англійською мовою, тому записи виконуються нею.

Після надходження записів спеціалісти VocaliD нарізають їх на окремі слова чи словосполучення, які можна склеювати разом у будь-якому порядку.

За оцінками Пател, голосовими донорами стало вже 500-600 осіб, а ще близько 24 тисяч записалися у добровольці та готуються зробити це в майбутньому.

«У минулому ми шукали придатний голос за базовими параметрами донора – віком та статтю, – розповідає спеціаліст. – Зараз ми розробляємо нові методи тоншого пошуку, щоб брати до уваги різні нюанси: якість голосу, хрипоту, акцент, зріст та вагу тощо».

У майбутньому VocaliD планує піти ще далі на шляху персоналізації та зробити так, щоб штучний голос дорослішав разом з пацієнтом. «Якщо у вас є записи людини з певними проміжками часу, ви побачите, що голос змінюється, – каже Пател. – Можливо, для цього не обов’язково шукати нового донора, а можна зробити це комп’ютерною обробкою».

Важливий голос

«Дуже важко переоцінити важливість голосу в тому, як ми презентуємо себе світу, – говорить науковець Університету Каліфорнії Джоді Крейман. – Так само, як при погляді на когось можна робити висновки, так само, і якщо почути їхній голос. Рівень освіти, здоров’я, зовнішній вигляд, соціальні здібності – усе це можна почути з голосу. Якщо його втратити, тоді втрачається соціальне «я».

Створювати штучні персоналізовані голоси трудомістке та тривале завдання. Поки що VoiceiD виконало його для трьох дівчат-підлітків. Вони звучать все ще роботизовано, але в їхньому голосі відстежується індивідуальність:

«Справжнє питання в тому, як швидко ми можемо повертати людям їхній голос, – розповідає Пател. – Список очікування нараховує понад тисячу пацієнтів. На створення кожного голосу, окрім запису донора, потрібно 10-15 годин».

У VocaliD також хочуть заробляти гроші не лише на інвалідах, а й продавати свої послуги звичайним людям. «Можна озвучувати вхідні електронні листи своїм голосом, – каже Пател. – Або зробити відеоігри персональнішими, надавши своїм віртуальним героям власний голос».

За матеріалами: The Atlantic

 

TechToday
TechTodayhttps://techtoday.in.ua
TechToday – це офіційний акаунт, яким користується редакція ресурсу

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися