Субота, 2 Листопада, 2024

Штучний інтелект клонує голос та знижує вартість аудіокниг на 90%

Китайський пошуковий гігант Sogou створив штучний інтелект, який дозволяє озвучувати книги голосами їхніх авторів. Це наступний етап еволюції представленої минулого року системи для державного новинного агентства Xinhua. Останнє і нині використовує штучний інтелект для зачитування новин.

Аудіокниги сьогодні стають дедалі популярнішими, причому тренд спостерігається як у Китаї, так і в країнах західної півкулі. Китайський медіагігант iiMedia прогнозує, що цей ринок у період з 2016 по 2020 подвоїться, досягши 7,8 млрд юанів на рік.

Технологія перетворення тексту на аудіо не є новою, але більшість користувачів люблять, коли це робить професіонал: актор, автор чи відома публічна фігура. Їхній час коштує дорого, і тому, вважають експерти, розроблене Sogou рішення дозволить зменшити затрати. Для створення синтетичного голосу, який майже точно копіює власника, потрібна лише хвилина запису.

Лондонський стартап DeepZen, який займається такими ж технологіями, каже, що синтетичний голос здатний створити аудіокнигу за кілька годин. Це зменшує затрати часу та коштів майже на 90%.

Євген
Євген
Євген пише для TechToday з 2012 року. Інженер за освітою. Захоплюється реставрацією старих автомобілів.

Vodafone

Залишайтеся з нами

10,052Фанитак
1,445Послідовникислідувати
105Абонентипідписуватися