Компьютеры достигли человеческого уровня в распознавании слов

26 августа 2017

Компьютерные технологии достигли новой метки развития – они сравнялись с людьми в распознавании текстов на слух. Такой результат показала система распознавания речи от Microsoft. Она слышит тексты почти идеально – уровень погрешностей составляет лишь 5,1%. Это результат профессиональных стенографистов.

В прошлом году эта система распознавания от Microsoft демонстрировала несколько худший результат – ее уровень составлял 5,9% неправильно понятых слов. Подобную цифру демонстрируют обычные люди, когда им нужно перевести аудиозапись чьего-то разговора в текстовый вид.

Для тестирования специалисты используют базу данных Switchboard – это пакет записанных телефонных разговоров. Последние 20 лет его используют как стандартное мерило качества распознавания текстов на разнообразные тематики, включая политику и спорт.

Нынешний результат системы Microsoft на 12% лучше, чем в прошлом году. Чтобы достичь его, исследователи ввели ряд улучшений в блоки акустической нейросети и моделей языка. Кроме этого, специалисты расширили словарный запас системы с 30 тысяч слов до 165 тысяч.

Главным фактором для увеличения качества распознавания стала система кратковременной и долговременной памяти на основе диалоговых сессий. Такой подход позволил при распознавании текстов использовать все предыдущие разговоры как историю для увеличения качества узнавания отдельных фраз. Благодаря этому система Microsoft может понимать, что она слушает разговор о спорте, и использовать соответствующие тематике варианты перевода.

Разработчики отмечают, что в сфере распознавания текстов еще много работы. Нужно совершенствовать качество распознавания в сложных условиях, таких как громкие помещения, переполненные шумом, а также искаженные акцентом фразы.

Не менее важной задачей, говорят разработчики, является обучение компьютеров не просто записывать услышанные слова в виде текста, а понимать значение и намерения услышанных фраз. Переход от простого распознавания к пониманию исследователи считают следующим рубежом технологий распознавания речи.

Система распознавания речи Microsoft уже работает в таких сервисах, как Cortana и Speech Translator.

Предыдущий рекорд в технологиях распознавания речи принадлежит IBM. Весной IBM удалось снизить уровень ошибок в компьютерном распознавании речи с 6,9% до 5,5%, а до этого рекорд принадлежал Microsoft (5,9%).

Теги
язык

1490

Компьютеры достигли человеческого уровня в распознавании слов

За два года база клиентов IoT Vodafone выросла на 73%

Microsoft закрывает собственный музыкальный сервис Groove

Как спрогнозировать, сколько лайков наберет ваше фото в соцсетях

Как настроить экран блокировки Android 14

Vodafone

Более 25 ТВ данных в первый день 5G в Киеве

Future You: в Киеве открыли интерактивную AI-инсталляцию, где можно встретиться с собой из будущего

Vodafone запустил 5G во всех районах Киева

200 тысяч клиентов протестировали 5G в Харькове

Vodafone Ukraine построит современный подземный дата-центр

Статті

Опросы на телефоне: как обещают заработок, а платят копейки

Производители используют одноразовые батарейки для экономии производства аккумуляторов

Этот научно-фантастический концепт Лунного кольца может отправить на Землю бесконечную чистую энергию

Конкуренция миллиардеров на орбите: кто первым высадит людей на Луну

Пять популярных аксессуаров для смартфонов, что лишь тратят деньги и создают иллюзию безопасности

AI-восстановление фото подменяет лица родственников, уничтожая настоящую семейную историю

Как выходит, что вы обогнали кого-то на дороге, а он снова появляется впереди: ученые объяснили невидимую силу статистики

ПОРАДИ

Как запретить Instagram использовать данные о ваших покупках для показа рекламы

Как сохранять места в Google Картах для упрощенного планирования путешествий

Как получить маникюр с эффектом кошачьего глаза с помощью зарядки Apple Watch

СТАТТІ

Опросы на телефоне: как обещают заработок, а платят копейки

Производители используют одноразовые батарейки для экономии производства аккумуляторов

Этот научно-фантастический концепт Лунного кольца может отправить на Землю бесконечную чистую энергию

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ

Компьютеры достигли человеческого уровня в распознавании слов

Vodafone

Залишайтеся з нами

Статті

ПОРАДИ

СТАТТІ

КАТЕГОРІЇ

ПРО НАС

СЛІДКУЙ ЗА НАМИ