Новости и события » Общество » "Siri, что ты любишь делать в дождливый день?". Facebook создал базу данных для обучения голосовых помощников

"Siri, что ты любишь делать в дождливый день?". Facebook создал базу данных для обучения голосовых помощников

"Siri, что ты любишь делать в дождливый день?". Facebook создал базу данных для обучения голосовых помощников

Программисты из Facebook представили базу данных, состоящую из более чем 160 тысяч отрывков диалогов реальных людей, которые беседовали от лица выдуманных "персон". Она получила название Persona-Chat и создана для улучшения возможностей голосовых помощников и любых "говорящих" с пользователем программ.

Разработчики также обучили компьютерную модель на примере этих данных. Эта модель может помочь персонифицировать чат-ботов и голосовых помощников.

Несмотря на то, что голосовые помощники и чат-боты с каждым годом становятся все совершеннее, поддержать беседу они все еще могут с трудом. Причиной тому - ограничения обучающей выборки: компьютер можно научить разговаривать и даже отвечать на вопросы, но для поддержания цельной беседы данных может быть недостаточно. Чат-бот, например, не обладает сформированной личностью и интересами - и поэтому не может ответить на сложные открытые вопросы вроде - "Что ты любишь делать в дождливый день?".

Разумеется, есть вариант, в котором чат-бот или голосовой помощник отвечает на неизвестный ему вопрос абстрактной фразой вроде "я не знаю" или поисковым запросом - но беседой считать это нельзя. Кроме того, при общении такой собеседник удерживает в памяти только небольшой отрывок диалога и не может вернуться к информации, предоставленной ему несколько минут назад.

Разработчики из Facebook AI Research под руководством Джейсона Вестона (Jason Weston) собрали базу данных из более чем тысячи "персон": небольших (пять предложений не более 15 слов в каждом) описаний абстрактных личностей, придуманных реальными людьми. Например, описание такой "персоны" может выглядеть так:

Всего в базе данных 1155 таких "персон". Кроме того, исследователи попросили другую группу людей оценить получившихся "персон" и переписать их на основе схожих, связанных характеристик: например, любовь к Maroon5 могла быть заменена в "персоне" на любовь к песне "She Will Be Loved", а утверждение о том, что отец "персоны" работал на Ford, могло превратиться в утверждение о том, что близкий родственник работал в автомобильной компании. Это необходимо для того, чтобы расширить известные о "персоне" факты для составления возможного диалога.

После этого двух людей, предоставивших "персоны", просили немного поговорить: каждому из них была назначена случайная "персона". В результате в базе данных диалогов оказалось 164 356 высказываний, и на основе этой базы исследователи обучили несколько компьютерных моделей (генеративную Seq2Seq и ранжирующую Memory Networks). Полученные модели чат-ботов затем оценили, попросив поговорить с ними реальных людей: диалог мог строиться либо вокруг "персоны" компьютера, либо вокруг "персоны" человека, либо вокруг обоих участников диалога. Разработанные модели обошли алгоритм, обученный диалогам на цитатах из фильмов, по беглости, вовлеченности в диалог и полноте беседы.

Разработчики отмечают, что собранная база данных может быть полезна для создания новых и усовершенствования старых моделей чат-ботов и голосовых помощников. База данных также выложена в открытый доступ.

Поддержание беседы на абстрактные темы - это скорее дополнение для голосовых помощников и чат-ботов. А их основной функцией кроме управления чем-либо и распознавания голосовых команд может быть даже оказание психологической поддержки: как Woebot, который при общении с пользователями использует методы когнитивно-поведенческой психотерапии.

"Siri, что ты любишь делать в дождливый день?". Facebook создал базу данных для обучения голосовых помощников

"Siri, что ты любишь делать в дождливый день?". Facebook создал базу данных для обучения голосовых помощников

"Siri, что ты любишь делать в дождливый день?". Facebook создал базу данных для обучения голосовых помощников

"Siri, что ты любишь делать в дождливый день?". Facebook создал базу данных для обучения голосовых помощников

Ford


У липні завдяки імпорту Respublika Park вдалося зменшити...

У липні завдяки імпорту Respublika Park вдалося зменшити використання української електроенергії

У липні, коли відновилися стабілізаційні відключення, в торгово-розважальному центрі Республіка власник почав використовувати імпортну електроенергію , що дало можливість значно знизити навантаження на українські електромережі. Згідно інформації, яку надали...

сегодня 13:06
  • Доставка из Германии в Украину с сервисом Meest Shopping

    Доставка из Германии в Украину с сервисом Meest Shopping

    Зарубежный интернет-магазин – это площадка, где можно найти широкий ассортимент качественных и недорогих товаров от известных производителей. Доставка из...

    29 августа 2024
  • Тротуарная плитка: свойства, виды и преимущества

    Тротуарная плитка: свойства, виды и преимущества

    Тротуарная плитка давно стала неотъемлемой частью городского ландшафта. Она используется не только для обустройства тротуаров, но и для мощения дворов,...

    4 июля 2024
  • Где лечить зубы в Харькове

    Где лечить зубы в Харькове

    Выбор стоматологии - это важный и ответственный процесс, требующий внимательного подхода и учета множества факторов. Пациенты стремятся найти клинику, которая...

    24 мая 2024
  • Перевод письменного текста

    Перевод письменного текста

    Перевод письменного текста – это процесс перевода текста на другой язык с помощью письменного переноса информации из одного языка на другой с учетом...

    4 мая 2024

Свежие новости Украины на сегодня и последние события в мире экономики и политики, культуры и спорта, технологий, здоровья, происшествий, авто и мото

Вверх