Speechmatics учит компьютеры понимать все 7000 языков

Распознавание человеческой речи было огромным вызовом для разработчиков, и он не решен полностью. Эта технология имеет последствия для интерфейсов «человек-машина» в таких областях, как робототехника, автономные транспортные средства и персональные компьютеры

Распознавание речи с помощью искусственного интеллекта вступает в новую фазу. Стартап Speechmatics поставил цель, достижение которой позволит ему опередить Apple, Google и другие технологические гиганты. Специалисты стартапа учат искусственный интеллект понять все 7000 языков мира.

Распознавание человеческой речи было огромным вызовом для разработчиков, и он не решен полностью. Эта технология имеет последствия для интерфейсов «человек-машина» в таких областях, как робототехника, автономные транспортные средства и персональные компьютеры, и все они выигрывают от компьютеров, способных точно интерпретировать естественный язык.

Сейчас распознавание речи хорошо работает для небольшой части населения мира. Ведь научить искусственный интеллект понимать речь дорого. Большинство учебных данных нужно классифицировать вручную, что означает, что точность достигается только для очень узкого набора сценариев.

Speechmatics использует другой подход к более репрезентативному распознаванию речи. На основе наборов данных, использованных в Стэнфордском исследовании «Расовые отличия в распознавании речи», Speechmatics зафиксировал общую точность 82,8% для голосов афроамериканцев по сравнению с Google (68,6%) и Amazon (68,6). Этот уровень точности равен 45% снижению ошибок распознавания речи – эквивалент трех слов в среднем предложении.

Стартап подвергает искусственный интеллект влиянию сотен тысяч отдельных голосов, используя немаркированные, более репрезентативные голосовые данные, не требующие вмешательства человека. Это помогло увеличить охват за пределы англоязычных пользователей.

В настоящее время механизм понимает 34 языка, которые являются небольшой каплей в очень большом лингвистическом ведре (в мире говорят более 7000 языков). Но платформа добилась поразительных успехов в знаках препинания, цифрах, валютах и адресах, которые традиционно мешают механизмам распознавания речи.

НАПИСАТИ ВІДПОВІДЬ

Коментуйте, будь-ласка!
Будь ласка введіть ваше ім'я