Amazon хочет научить Alexa корректно понимать местоимения
Понимание и обработка речевых ссылок - это большой вызов для направления обработки естественного языка в контексте ИИ-помощников, таких как Amazon Alexa. Данная проблема, как правило, подразумевает под собой корректное ассоциирование местоимений в запросах пользователей с подразумеваемыми понятиями, например, сопоставление местоимения "их" в высказывании "включи их последний альбом" с каким-то музыкальным исполнителем. Специалисты по ИИ из Amazon активно работают над технологией, которая бы могла помочь ИИ с обработкой подобных запросов при помощи автоматической переформулировки и замены. Так, запрос "Воспроизведи их последний альбом" будет автоматически заменен на "Воспроизведи последний альбом Imagine Dragons". При этом необходимое для замены слово подбирается в соответствии с вероятностным подходом, вычисленным при помощи машинного обучения.
Ученые опубликовали предварительный результат своей работы в препринте с довольно непростым названием - "Масштабирование отслеживания состояния многодоменного диалога с помощью переформулирования запросов". В ближайшее время планируется презентовать данное исследование в Североамериканском отделении Ассоциации компьютерной лингвистики.
"Поскольку наш механизм переформулирования запросов использует общие принципы применения речевых ссылок, он не зависит от какой-либо специфичной информации о приложении, где он будет применяться, поэтому он не требует переобучения, когда мы с его помощью расширяем возможности Alexa", - пояснил Арит Гупта (Arit Gupta), эксперт по лингвистике в отделе Amazon Alexa AI. Он отметил, что их новая технология, получившая название CQR (contextual query rewriting), полностью освобождает внутренний код голосового ассистента от какого-либо беспокойства по поводу речевых ссылок в запросах.
Вначале ИИ определяет общий контекст запроса: какую информацию хочет получить пользователь или какое действие выполнить. В процессе диалога с пользователем ИИ классифицирует ключевые слова, сохраняя их в специальных переменных для дальнейшего использования. Если очередной запрос будет содержать какую-либо ссылку, то ИИ попытается заменить ее наиболее вероятным из сохраненных и семантически подходящих слов, а если такого не окажется в памяти, то обратится к внутреннему словарю наиболее часто используемых значений, а затем пересоберет запрос с примененной заменой, чтобы передать его дальше голосовому помощнику для выполнения.
Как указывает Гупта и его коллеги, CQR выступает как слой предварительной обработки голосовых команд и сосредоточен только на синтаксических и семантических значениях слов. В экспериментах со специально подготовленным набором данных, CQR улучшил точность обработки запросов на 22%, когда ссылка в текущем запросе относится к слову, которое использовалось в самом последнем ответе, и на 25%, когда ссылка в текущем высказывании ссылается на слово из предыдущего высказывании.