Microsoft достигла нового уровня в системе распознавания речи
Команда разработчиков Microsoft поделилась деталями о новой технологии распознавания речи, над которой в настоящее время ведет работу. По словам специалистов, новая разработка способна расшифровывать разговорную речь точно так же, как это делает человек.
Главный ученый Microsoft Ксуедонг Хуан (Xuedong Huang), занимающийся речевыми разработками, отметил, что его команда сумела достичь человеческого паритета. "Это историческое достижение", - не без гордости подчеркнул он.
Уровень ошибочных распознаваний составляет 5,9%, и это сопоставимо с профессиональными транскрипционистами, которые работали над одной и той же речью. Исследователи рассказывают, что технология использует нейронные языковые модели, которые группируют схожие слова и тем самым способствуют эффективному обобщению. Разработка будет использоваться в работе голосового помощника Кортаны, а также в софте по переводу устной речи в письменную.