Speechmatics учить комп’ютери розуміти всі 7000 мов

5 Липня 2022

Розпізнавання мовлення за допомогою штучного інтелекту вступає в нову фазу. Стартап Speechmatics поставив мету, досягнення якої дозволить йому випередити Apple, Google та інших технологічних гігантів. Фахівці стартапу вчать штучний інтелект зрозуміти всі 7000 мов світу.

Розпізнавання людського мовлення було величезним викликом для розробників, і він не вирішений повністю. Ця технологія має наслідки для інтерфейсів «людина-машина» в таких сферах, як робототехніка, автономні транспортні засоби та персональні комп’ютери, і всі вони виграють від комп’ютерів, здатних точно інтерпретувати природну мову.

Зараз розпізнавання мовлення добре працює для невеликої частини населення світу. Адже навчити штучний інтелект розуміти мовлення дорого. Більшість навчальних даних потрібно класифікувати вручну, а це означає, що точність досягається лише для дуже вузького набору сценаріїв.

Speechmatics використовує інший підхід до більш репрезентативного розпізнавання мовлення. На основі наборів даних, використаних у Стенфордському дослідженні «Расові відмінності в розпізнаванні мовлення», Speechmatics зафіксував загальну точність 82,8% для голосів афроамериканців порівняно з Google (68,6%) і Amazon (68,6). Цей рівень точності дорівнює 45% зниженню помилок розпізнавання мовлення – еквівалент трьох слів у середньому реченні.

Стартап піддає штучний інтелект впливу сотень тисяч окремих голосів, використовуючи немарковані, більш репрезентативні голосові дані, які не потребують втручання людини. Це допомогло збільшити охоплення за межі англомовних користувачів.

Наразі механізм розуміє 34 мови, що є невеликою краплею у дуже великому лінгвістичному відрі (у світі розмовляють понад 7000 мовами). Але платформа досягла вражаючих успіхів у розділових знаках, цифрах, валютах і адресах, які традиційно заважають механізмам розпізнавання мовлення.

Теги
Технології

852

Speechmatics учить комп’ютери розуміти всі 7000 мов

МТС умеет управлять качеством – подтверждает аудит

Смартфон, закрой за пользователем дверь

Як у Windows 11 змінити папку скриншотів за замовчуванням

Повідомлення на Android друзі зможуть малювати

Vodafone

200 тисяч клієнтів протестували 5G у Харкові

Vodafone Україна побудує надсучасний підземний дата-центр

Vodafone Україна залучив €30 млн фінансування для розвитку мережі у співпраці з Nokia, ING та Finnvera

Інтернет Vodafone, що працює без електрики, охопив 2 млн домогосподарств

Vodafone додав сонячну генерацію на перші 100 базових станцій

Статті

AI-відновлення фото підміняє обличчя родичів, знищуючи справжню сімейну історію

Як виходить, що ви обігнали когось на дорозі, а він знову з’являється попереду: вчені пояснили невидиму силу статистики

2026 рік: хай-тек на межі краху, мільярди зникають, а користувачі стають жертвами

Чи може штучний інтелект генерувати нові ідеї?

Чи можна зупинити розплавлення ядерного реактора?

Здається, пари почали використовувати чат-ботів як заміну реальним стосункам

Імперія спостереження, яка відстежувала світових лідерів, ворога Ватикану і, можливо, вас

ПОРАДИ

Чому iPhone робить екран тьмянішим

Як оновити iPad через Finder на комп’ютері Mac при невдалому встановленні iPadOS

Як приховати останній візит і статус «онлайн» у Telegram

СТАТТІ

AI-відновлення фото підміняє обличчя родичів, знищуючи справжню сімейну історію

Як виходить, що ви обігнали когось на дорозі, а він знову з’являється попереду: вчені пояснили невидиму силу статистики

2026 рік: хай-тек на межі краху, мільярди зникають, а користувачі стають жертвами

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ

Speechmatics учить комп’ютери розуміти всі 7000 мов

Vodafone

Залишайтеся з нами

Статті

ПОРАДИ

СТАТТІ

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ