IBM рекордно снизила долю ошибок в компьютерном распознавании речи
Искусственный интеллект компании уменьшил количество неверно распознанных слов с 6,9% до 5,5%, поставив новый мировой рекорд.
Ранее пальма первенства принадлежала алгоритму Microsoft с показателем 5,9%. Для человека доля ошибок при восприятии беглой речи составляет 5%. По словам исследователя IBM Джорджа Саона, сейчас ИИ плохо улавливает сложные нюансы речи (например, изменение тона или метафоры), но уже по-настоящему хорошо распознает прямые значения слов.
Теперь компания намерена снизить процент ошибок до 5,1%. Технически этот показатель означает, что программа сравнится с человеком и сможет различать даже разговорные «полутона».
Прорыв IBM важен для всего рынка когнитивных технологий, но в первую очередь - для голосовых помощников типа Siri, Alexa, Google Assistant и других решений, использующих общительные интерфейсы.
Ранее мы писали, что ИИ за год сэкономил юристам 45 тысяч рабочих дней, а в МТИ создали GPS для социального взаимодействия, который здорово считывает эмоции собеседника.