Комп’ютери досягли людського рівня в розпізнаванні слів

26 Серпня 2017

Комп’ютерні технології досягли нової позначки розвитку – вони зрівнялися з людьми в розпізнаванні текстів на слух. Такий результат показала система розпізнавання мови від Microsoft. Вона чує тексти майже ідеально – рівень похибок складає лише 5,1%. Це результат професійних стенографістів.

Минулого року ця система розпізнавання від Microsoft демонструвала дещо гірший результат – її рівень складав 5,9% неправильно зрозумілих слів. Подібну цифру демонструють звичайні люди, коли їм треба перевести аудіозапис чиєїсь розмови у текстовий вигляд.

Для тестування фахівці використовують базу даних Switchboard – це пакет записаних телефонних розмов. Останні 20 років його використовують як стандартне мірило якості розпізнавання текстів на різноманітні тематики, з політикою та спортом включно.

Нинішній результат системи Microsoft на 12% кращий, ніж минулого року. Щоб досягти його, дослідники запровадили певні поліпшення у блоки акустичної нейромережі та моделей мови. Окрім цього, фахівці розширили словниковий запас системи з 30 тисяч слів до 165 тисяч.

Головним фактором для збільшення якості розпізнавання стала система короткочасної та довгострокової пам’яті на основі діалогових сесій. Такий підхід дозволив при розпізнаванні текстів використовувати всі попередні розмови як історію для збільшення якості впізнавання окремих фраз. Завдяки цьому система Microsoft може розуміти, що вона слухає розмову про спорт, і використовувати відповідні тематиці варіанти перекладу.

Розробники відзначають, що у сфері розпізнавання текстів ще багато роботи. Потрібно вдосконалювати якість розпізнавання у складних умовах, таких як гучні приміщення, переповнені шумом, а також спотворені акцентом фрази.

Не менш важливим завданням, кажуть розробники, є навчання комп’ютерів не просто записувати почуті слова у вигляді тексту, а розуміти значення та наміри почутих фраз. Перехід від простого розпізнавання до розуміння дослідники вважають наступним рубежем технологій розпізнавання мови.

Система розпізнавання мови Microsoft вже працює в таких сервісах, як Cortana та Speech Translator.

Попередній рекорд у технологіях розпізнавання мовлення належить IBM. Навесні IBM вдалося знизити рівень помилок у комп’ютерному розпізнавання мовлення з 6,9% до 5,5%, а до цього рекорд належав Microsoft (5,9%).

Теги
мова

1051

Комп’ютери досягли людського рівня в розпізнаванні слів

Смартфон з портативним монітором – новий клас пристроїв від Samsung та LG

AirPods руйнують слух. Чому не допомагають функції піклування про здоров’я?

З Google Диск зникають файли: постраждалі втратили дані за 6 місяців

Інсталяція розширень Opera в Chrome

Vodafone

Понад 25 ТБ даних у перший день 5G у Києві

Future You: у Києві відкрили інтерактивну AI-інсталяцію, де можна зустрітися із собою з майбутнього

Vodafone запустив 5G у всіх районах Києва

200 тисяч клієнтів протестували 5G у Харкові

Vodafone Україна побудує надсучасний підземний дата-центр

Статті

Опитування на телефоні: як обіцяють заробіток, а платять копійки

Виробники використовують одноразові батарейки задля економії на виготовленні акумуляторів

Космічне кільце на Місяці: нескінченна енергія на Землю чи чергова мрія?

Конкуренція мільярдерів на орбіті: хто першим висадить людей на Місяць

П’ять популярних аксесуарів для смартфонів, що лише марнують гроші та створюють ілюзію безпеки

AI-відновлення фото підміняє обличчя родичів, знищуючи справжню сімейну історію

Як виходить, що ви обігнали когось на дорозі, а він знову з’являється попереду: вчені пояснили невидиму силу статистики

ПОРАДИ

Як зберігати місця в Google Картах для спрощеного планування подорожей

Як отримати манікюр з ефектом котячого ока за допомогою зарядки Apple Watch

Як створити акаунт WhatsApp без номера телефону

СТАТТІ

Опитування на телефоні: як обіцяють заробіток, а платять копійки

Виробники використовують одноразові батарейки задля економії на виготовленні акумуляторів

Космічне кільце на Місяці: нескінченна енергія на Землю чи чергова мрія?

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ

Комп’ютери досягли людського рівня в розпізнаванні слів

Vodafone

Залишайтеся з нами

Статті

ПОРАДИ

СТАТТІ

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ