Новости и события » Hi-Tech » Система распознавания речи Microsoft достигла человеческого уровня

Система распознавания речи Microsoft достигла человеческого уровня

Система распознавания речи Microsoft достигла человеческого уровня

Технология распознавания голоса Microsoft впервые достигла уровня, аналогичного человеческому. Об этом сообщила пресс-служба компании.

Исследователям Microsoft Research удалось снизить долю ошибок до 5,1%, тогда как у человека этот показатель по данным ученых составляет от 5 до 6%. Как отмечают разработчики, это значительный шаг вперед по сравнению с показателем 6,3%, который система распознавания Microsoft показывала в сентябре 2017 года.

В научной работе, опубликованной сотрудниками Microsoft Research, описаны последние нововведения, которые позволили достичь настолько низкого уровня ошибок. Ученые использовали сочетание сверточной нейронной сети (CNN) и модели долгой краткосрочной памяти (LSTM), а также ряд подходов, которые и ранее применялись в машинном распознавании речи.

Для проверки результатов использовался тест Switchboard ("Коммутатор") - это общепринятый в индустрии языковой корпус, на котором испытывают работу машинного распознавания английской речи. Он состоит из записей разговоров нескольких человек на определенные темы.

Существует и другой, более сложный тест, он называется CallHome ("Звонок домой"), где собеседников больше, а тема разговора не задана. В нем нейросетям пока что лишь предстоит сравняться с человеком: частота ошибок машинного распознавания речи Microsoft здесь еще превышает 10%.

Технология распознавания речи используется в операционной системе Windows, цифровом ассистенте Cortana, Microsoft Office, Skype и прочих приложениях компании. Предполагается, что ее улучшенная версия будет введена в эксплуатацию в ближайшие несколько месяцев.

Microsoft


Свежие новости Украины на сегодня и последние события в мире экономики и политики, культуры и спорта, технологий, здоровья, происшествий, авто и мото

Вверх