Нейросеть научили выявлять вредные привычки по соцсети
Согласно данным Национального исследования наркопотребления и здоровья (NSDUG) США, зависимостью от психоактивных веществ страдает около десяти процентов американцев. В России показатель вдвое больше - 20,9 процента. При этом в последнее время ученые все чаще выявляют связь между склонностью к употреблению подобных веществ и специфическими чертами личности. Так, алкоголизм положительно коррелирует с экстравертностью и просоциальностью, а табакокурение ассоциируется с низкой самодисциплиной и открытостью новому опыту. Побочные эффекты такой зависимости вместе с тем могут зависеть от социодемографических параметров, например уровня дохода и места проживания.
В новой работе американские исследователи проверили гипотезу о том, что на характер зависимости может указывать активность интернет-пользователей в социальных сетях. На первом этапе они обучили компьютерный алгоритм распознавать склонность человека к вредным привычкам. В тренировках использовались три базы данных, полученных в 2007-2012 годах с помощью психометрического приложения myPersonality для Facebook. Первая база содержала информацию о 5 миллионах лайков 250 тысяч посетителей сайта; вторая - о 21 миллионе публикаций 100 тысяч пользователей; третья - о наличии зависимости у 13,5 тысячи человек. При обучении эти сведения комбинировались.
Последующие тесты показали, что система может определять вредные привычки с высокой точностью: 84 процента - для наркотических веществ, 81 и 86 процентов - для алкоголь- и никотин-зависимости соответственно. Примечательно, что ученые также обнаружили связь склонностей с содержанием публикаций. В частности, пользователи, употреблявшие наркотики, чаще использовали понятия, связанные со здоровьем («таблетки», «больница») и агрессией («убивать», «ненависть»). Помимо этого, такие пользователи чаще лайкали записи с упоминанием музыкальных групп Depeche Mode, The Cure, пьющие алкоголь предпочитали фильм «V - значит Вендетта», а курящие табак - Роба Зомби.
Несмотря на высокую точность алгоритма, авторы отмечают, что о выявлении причинно-следственных связей речь не идет. Также общий набор данных был значительно меньше, чем объем каждой базы, - всего 3508 пользователей социальной сети. Уточнить полученные данные может дополнительное исследование на более крупной выборке. Ранее нейросети уже использовали для идентификации различных параметров личности. Так, алгоритмы хорошо справились с определением имени человека по фотографии, оценкой преступного умысла и распознаванием антисоциальных черт по строению лица. На днях японские ученые натренировали глубокую нейросеть проявлять воображение.
Подробности работы представлены на сервере препринтов arXiv.org.