Ученые РЭА им. Н.В. Плеханова научат компьютер и гаджеты говорить правильно
Ученые из Российского экономического университета имени Г.В. Плеханова создали сервис для разработчиков приложений и пользователей, который формирует грамматически правильный текст на русском языке. Программный модуль в основе сервиса отвечает на индивидуальные запросы и позволяет "научить" автоматические системы избегать грамматических и речевых ошибок при синтезе текста.
Разработчики компьютерных программ стремятся сделать так, чтобы их взаимодействие с человеком все больше было похоже на простое человеческое общение. Для этого разрабатываются алгоритмы, формирующие фразы на основании правил языка взаимодействия, либо закладываются шаблонные фразы. Русский язык относится к числу языков с богатой морфологией и развитой грамматикой, достаточно сложно поддающихся алгоритмическому описанию: при спряжении изменяются сложным образом "неправильные" глаголы, нерегулярно изменяются окончания существительных при их склонении по падежам и числам.
Применяя общие правила к незнакомым словам и словосочетаниям, ошибаются не только изучающие язык, но даже носители, а вероятность ошибки автоматической системы, не оснащенной модулем лингвистической поддержки, весьма высока. Не меньшая трудность - перевод в текст числовых данных. Поэтому часто можно услышать, как навигатор неправильно произносит маршрут, или автоинформатор называет с речевыми ошибками сумму остатка на банковском счете клиента.
Группа разработчиков под руководством профессора Тимура Садыкова из РЭУ предложила новый подход к решению проблемы и создала программу, которая на основании заложенных математических алгоритмов автоматически правильно видоизменяет слова, формирует и изменяет словосочетания, а также синтезирует грамматически корректный текст по вводным данным. Программный модуль может использоваться разработчиками для улучшения качества взаимодействия собственных приложений и сервисов с пользователями там, где требуется обрабатывать большие массивы текстов: сервисы автоинформирования, навигации, интерактивные руководства и программы-помощники.
"Цель нашего проекта - создать полностью автоматическую среду, способную видоизменять слова, согласовывать словосочетания, анализировать правильность всего текста, чтобы компьютерные программы "разговаривали" с пользователями без ошибок в русском языке. Мы видим перспективу развития системы в том, чтобы дать людям возможность по любым точным входным данным - числовым, табличным, логическим и прочим - формировать грамматически правильный текст на русском языке любого уровня сложности. Наш сервис - это полностью детерминированное алгоритмическое решение, лишь в самой минимальной степени зависимое от словарных данных", - рассказал научный руководитель проекта, профессор кафедры информатики РЭУ им. Г.В. Плеханова Тимур Садыков.
В настоящее время сервис в режиме тестирования и улучшения. Пока система допускает ошибки, когда пользователь подает запрос на изменение какого-то редкого, нетипичного для русского языка слова. Синтез грамматически правильного текста на русском языке в настоящий момент возможен для ограниченного набора исходных данных, описывающих, в частности, арифметические операции, курсы валют и прогноз погоды.
Для обработки единичных запросов рядовых пользователей сервис доступен на интернет-сайте по адресу http://passare.ru/ (в честь известного шведского математика Микаэля Пассаре (1959-2011), который был президентом шведского математического общества и в совершенстве владел многими иностранными языками) и имеет русский и англоязычный интерфейсы. На сайте пользователю доступны три группы функций - видоизменение, согласование и синтез текста. Так, при введении запроса на синтез текста по теме "Погода" в заданном городе России система автоматически запрашивает данные на сайте с метеорологическими данными о прогнозе погоды на ближайшие 24 часа, преобразует их в грамматически правильный текст на русском языке, и отображает его на экране.