У світі нараховується близько 2,5 млн людей, які з різних причин втратили можливість розмовляти власним голосом, і за них це робить комп’ютер. Електронний голос звучить постійно однаково, і таких пацієнтів не відрізнити на слух. Однак скоро це може змінитися, адже у світі з’явився банк голосу, куди можна пожертвувати і свій.
Один з найпопулярніших фізиків – Стівен Хокінг – відомий також своєю системою комунікації. Літери вимовляє комп’ютер, і цей голос став іконою, а сам науковець вже вважає його своїм. Він користується однією системою комунікації вже понад 20 років, але його хвороба продовжує прогресувати, і поточне рішення вже не справляється. І коли у Intel почали роботу над новою, поліпшеною, версією системи, у Хокінга була лише одна вимога – залишити його голос без змін.
«Цей голос став таким відомим, що він вважає його персональним голосом, – розповідає Хорст Хоссекер. Він працює керівником проекту оновлення комунікаційної системи та займає посаду директора лабораторії Intel Computational Imaging Lab. – Він заснований на застарілій технології, але це робить його унікальним і його неможливо скопіювати, навіть якщо захотіти».
![9953913_orig](https://techtoday.in.ua/wp-content/uploads/2015/01/9953913_orig.jpg)
Ідея банку голосу
Незважаючи на те, що люди втрачають здатність розмовляти, вони все одно хочуть демонструвати свою природну індивідуальність навіть при спілкуванні через комп’ютер. Дослідниця Рупал Пател у 2002 році з’ясувала, що для цього вони змінюють тембр та висоту комп’ютерного голосу так, щоб він був максимально схожий на їхній власний. Проте це не допомагало, і розрізнити особистість користувача на слух було неможливо.
«Я склала два плюс два, – згадує вона, – Я подумала, що якщо в них є ця частина голосу, тоді можна збудувати для них персональне звучання».
Ця ідея залишилася, і в наступні роки Пател розвивала свої технології. У 2007 році вона започаткувала свою компанію VocaliD, мета якої – створювати персональний голос для комп’ютерних систем мовлення, які використовують німі люди. Для цього вона змішує звуки, що видають пацієнти, із записами слів від здорових донорів. Ця послуга платна, а ціна фінального «голосу» залежить від початкових вимог.
Створювати індивідуальний голос спеціалістам VocaliD вдається завдяки тому, що звучання людини складається з двох компонентів. Голосові зв’язки генерують звук, а індивідуальності йому додає фільтр – шлях, по якому проходить повітря всередині тіла. Різноманітні травми впливають якраз на останній, а ось голосові зв’язки залишаються робочими.
Завдання експертів VocaliD – знайти такого донора, який має схожий фільтр, та за допомогою сучасних технологій накласти його на звуки, які видає пацієнт. Стати донором такого банку голосу може кожен – для цього потрібний комп’ютер, мікрофон та декілька годин для запису сотень підготовлених речень. Поки що компанія працює лише з англійською мовою, тому записи виконуються нею.
Після надходження записів спеціалісти VocaliD нарізають їх на окремі слова чи словосполучення, які можна склеювати разом у будь-якому порядку.
За оцінками Пател, голосовими донорами стало вже 500-600 осіб, а ще близько 24 тисяч записалися у добровольці та готуються зробити це в майбутньому.
«У минулому ми шукали придатний голос за базовими параметрами донора – віком та статтю, – розповідає спеціаліст. – Зараз ми розробляємо нові методи тоншого пошуку, щоб брати до уваги різні нюанси: якість голосу, хрипоту, акцент, зріст та вагу тощо».
У майбутньому VocaliD планує піти ще далі на шляху персоналізації та зробити так, щоб штучний голос дорослішав разом з пацієнтом. «Якщо у вас є записи людини з певними проміжками часу, ви побачите, що голос змінюється, – каже Пател. – Можливо, для цього не обов’язково шукати нового донора, а можна зробити це комп’ютерною обробкою».
Важливий голос
«Дуже важко переоцінити важливість голосу в тому, як ми презентуємо себе світу, – говорить науковець Університету Каліфорнії Джоді Крейман. – Так само, як при погляді на когось можна робити висновки, так само, і якщо почути їхній голос. Рівень освіти, здоров’я, зовнішній вигляд, соціальні здібності – усе це можна почути з голосу. Якщо його втратити, тоді втрачається соціальне «я».
Створювати штучні персоналізовані голоси трудомістке та тривале завдання. Поки що VoiceiD виконало його для трьох дівчат-підлітків. Вони звучать все ще роботизовано, але в їхньому голосі відстежується індивідуальність:
«Справжнє питання в тому, як швидко ми можемо повертати людям їхній голос, – розповідає Пател. – Список очікування нараховує понад тисячу пацієнтів. На створення кожного голосу, окрім запису донора, потрібно 10-15 годин».
У VocaliD також хочуть заробляти гроші не лише на інвалідах, а й продавати свої послуги звичайним людям. «Можна озвучувати вхідні електронні листи своїм голосом, – каже Пател. – Або зробити відеоігри персональнішими, надавши своїм віртуальним героям власний голос».
За матеріалами: The Atlantic