Лингвисты научили компьютер понимать степень эмоциональности текста
Лингвисты Института филологии и языковой коммуникации Сибирского федерального университета создали технологию автоматического анализа силы эмоций, содержащихся в тексте. Разработчики отмечают, что данный проект по своей значимости находится на мировом уровне.
Прикладная лингвистика - особая междисциплинарная область, которая работает на стыке литературы, психологии, нейрофизиологии, информационных технологий, философии. Результаты исследований текстов и речи находят применение практически во всех сферах человеческой деятельности. Разработками прикладной лингвистики пользуются спецслужбы, психологи, рекламщики и политтехнологи.
Существующие системы автоматического анализа текстов позволяют оценивать только позитивную, негативную окраску текста на основании ключевых слов. Разработка красноярских ученых может мгновенно "понять" не только окраску текста, но и оценить силу эмоционального переживания, содержащегося в нем.
На основе выборки текстов, в которых отражены базовые эмоции (например: страх, гнев, отвращение, радость, удивление и другие), были выделены характерные описывающие их слова и сочетания (маркеры) и созданы соответствующие лингвистические модели. Наличие маркеров в тексте позволяет оценить то, какие эмоции содержит текст, какие в нем оттенки эмоционального переживания, насколько они сильные.
"Ранжированный классификатор очень востребован для анализа сообщений, постов в социальных сетях, - отмечает заведующая кафедрой романских языков и прикладной лингвистики СФУ доктор филологических наук, профессор Анастасия Колмогорова. - Заказчиками могут выступать промышленные компании, маркетинговые структуры, политические партии".
Еще одна прикладная разработка СФУ, над которой команда ученых-лингвистов работает в настоящий момент, способна оценить тексты по уровню манипулятивного воздействия. Создаваемый алгоритм позволяет компьютеру выявлять признаки скрытых манипуляций в тексте, наличие призывов к противоправным действиям. Программный продукт может оказаться востребованным, когда необходима независимая лингвистическая экспертиза текста.