У світі нараховується близько 2,5 млн людей, які з різних причин втратили можливість розмовляти власним голосом, і за них це робить комп’ютер. Електронний голос звучить постійно однаково, і таких пацієнтів не відрізнити на слух. Однак скоро це може змінитися, адже у світі з’явився банк голосу, куди можна пожертвувати і свій.
Один з найпопулярніших фізиків – Стівен Хокінг – відомий також своєю системою комунікації. Літери вимовляє комп’ютер, і цей голос став іконою, а сам науковець вже вважає його своїм. Він користується однією системою комунікації вже понад 20 років, але його хвороба продовжує прогресувати, і поточне рішення вже не справляється. І коли у Intel почали роботу над новою, поліпшеною, версією системи, у Хокінга була лише одна вимога – залишити його голос без змін.
«Цей голос став таким відомим, що він вважає його персональним голосом, – розповідає Хорст Хоссекер. Він працює керівником проекту оновлення комунікаційної системи та займає посаду директора лабораторії Intel Computational Imaging Lab. – Він заснований на застарілій технології, але це робить його унікальним і його неможливо скопіювати, навіть якщо захотіти».
Ідея банку голосу
Незважаючи на те, що люди втрачають здатність розмовляти, вони все одно хочуть демонструвати свою природну індивідуальність навіть при спілкуванні через комп’ютер. Дослідниця Рупал Пател у 2002 році з’ясувала, що для цього вони змінюють тембр та висоту комп’ютерного голосу так, щоб він був максимально схожий на їхній власний. Проте це не допомагало, і розрізнити особистість користувача на слух було неможливо.
«Я склала два плюс два, – згадує вона, – Я подумала, що якщо в них є ця частина голосу, тоді можна збудувати для них персональне звучання».
Ця ідея залишилася, і в наступні роки Пател розвивала свої технології. У 2007 році вона започаткувала свою компанію VocaliD, мета якої – створювати персональний голос для комп’ютерних систем мовлення, які використовують німі люди. Для цього вона змішує звуки, що видають пацієнти, із записами слів від здорових донорів. Ця послуга платна, а ціна фінального «голосу» залежить від початкових вимог.
Створювати індивідуальний голос спеціалістам VocaliD вдається завдяки тому, що звучання людини складається з двох компонентів. Голосові зв’язки генерують звук, а індивідуальності йому додає фільтр – шлях, по якому проходить повітря всередині тіла. Різноманітні травми впливають якраз на останній, а ось голосові зв’язки залишаються робочими.
Завдання експертів VocaliD – знайти такого донора, який має схожий фільтр, та за допомогою сучасних технологій накласти його на звуки, які видає пацієнт. Стати донором такого банку голосу може кожен – для цього потрібний комп’ютер, мікрофон та декілька годин для запису сотень підготовлених речень. Поки що компанія працює лише з англійською мовою, тому записи виконуються нею.
Після надходження записів спеціалісти VocaliD нарізають їх на окремі слова чи словосполучення, які можна склеювати разом у будь-якому порядку.
За оцінками Пател, голосовими донорами стало вже 500-600 осіб, а ще близько 24 тисяч записалися у добровольці та готуються зробити це в майбутньому.
«У минулому ми шукали придатний голос за базовими параметрами донора – віком та статтю, – розповідає спеціаліст. – Зараз ми розробляємо нові методи тоншого пошуку, щоб брати до уваги різні нюанси: якість голосу, хрипоту, акцент, зріст та вагу тощо».
У майбутньому VocaliD планує піти ще далі на шляху персоналізації та зробити так, щоб штучний голос дорослішав разом з пацієнтом. «Якщо у вас є записи людини з певними проміжками часу, ви побачите, що голос змінюється, – каже Пател. – Можливо, для цього не обов’язково шукати нового донора, а можна зробити це комп’ютерною обробкою».
Важливий голос
«Дуже важко переоцінити важливість голосу в тому, як ми презентуємо себе світу, – говорить науковець Університету Каліфорнії Джоді Крейман. – Так само, як при погляді на когось можна робити висновки, так само, і якщо почути їхній голос. Рівень освіти, здоров’я, зовнішній вигляд, соціальні здібності – усе це можна почути з голосу. Якщо його втратити, тоді втрачається соціальне «я».
Створювати штучні персоналізовані голоси трудомістке та тривале завдання. Поки що VoiceiD виконало його для трьох дівчат-підлітків. Вони звучать все ще роботизовано, але в їхньому голосі відстежується індивідуальність:
«Справжнє питання в тому, як швидко ми можемо повертати людям їхній голос, – розповідає Пател. – Список очікування нараховує понад тисячу пацієнтів. На створення кожного голосу, окрім запису донора, потрібно 10-15 годин».
У VocaliD також хочуть заробляти гроші не лише на інвалідах, а й продавати свої послуги звичайним людям. «Можна озвучувати вхідні електронні листи своїм голосом, – каже Пател. – Або зробити відеоігри персональнішими, надавши своїм віртуальним героям власний голос».
За матеріалами: The Atlantic