"Siri, что ты любишь делать в дождливый день?". Facebook создал базу данных для обучения голосовых помощников
Программисты из Facebook представили базу данных, состоящую из более чем 160 тысяч отрывков диалогов реальных людей, которые беседовали от лица выдуманных "персон". Она получила название Persona-Chat и создана для улучшения возможностей голосовых помощников и любых "говорящих" с пользователем программ.
Разработчики также обучили компьютерную модель на примере этих данных. Эта модель может помочь персонифицировать чат-ботов и голосовых помощников.
Несмотря на то, что голосовые помощники и чат-боты с каждым годом становятся все совершеннее, поддержать беседу они все еще могут с трудом. Причиной тому - ограничения обучающей выборки: компьютер можно научить разговаривать и даже отвечать на вопросы, но для поддержания цельной беседы данных может быть недостаточно. Чат-бот, например, не обладает сформированной личностью и интересами - и поэтому не может ответить на сложные открытые вопросы вроде - "Что ты любишь делать в дождливый день?".
Разумеется, есть вариант, в котором чат-бот или голосовой помощник отвечает на неизвестный ему вопрос абстрактной фразой вроде "я не знаю" или поисковым запросом - но беседой считать это нельзя. Кроме того, при общении такой собеседник удерживает в памяти только небольшой отрывок диалога и не может вернуться к информации, предоставленной ему несколько минут назад.
Разработчики из Facebook AI Research под руководством Джейсона Вестона (Jason Weston) собрали базу данных из более чем тысячи "персон": небольших (пять предложений не более 15 слов в каждом) описаний абстрактных личностей, придуманных реальными людьми. Например, описание такой "персоны" может выглядеть так:
Всего в базе данных 1155 таких "персон". Кроме того, исследователи попросили другую группу людей оценить получившихся "персон" и переписать их на основе схожих, связанных характеристик: например, любовь к Maroon5 могла быть заменена в "персоне" на любовь к песне "She Will Be Loved", а утверждение о том, что отец "персоны" работал на Ford, могло превратиться в утверждение о том, что близкий родственник работал в автомобильной компании. Это необходимо для того, чтобы расширить известные о "персоне" факты для составления возможного диалога.
После этого двух людей, предоставивших "персоны", просили немного поговорить: каждому из них была назначена случайная "персона". В результате в базе данных диалогов оказалось 164 356 высказываний, и на основе этой базы исследователи обучили несколько компьютерных моделей (генеративную Seq2Seq и ранжирующую Memory Networks). Полученные модели чат-ботов затем оценили, попросив поговорить с ними реальных людей: диалог мог строиться либо вокруг "персоны" компьютера, либо вокруг "персоны" человека, либо вокруг обоих участников диалога. Разработанные модели обошли алгоритм, обученный диалогам на цитатах из фильмов, по беглости, вовлеченности в диалог и полноте беседы.
Разработчики отмечают, что собранная база данных может быть полезна для создания новых и усовершенствования старых моделей чат-ботов и голосовых помощников. База данных также выложена в открытый доступ.
Поддержание беседы на абстрактные темы - это скорее дополнение для голосовых помощников и чат-ботов. А их основной функцией кроме управления чем-либо и распознавания голосовых команд может быть даже оказание психологической поддержки: как Woebot, который при общении с пользователями использует методы когнитивно-поведенческой психотерапии.