Машинное обучение вычислило торговцев опиоидами в Twitter
С помощью машинного обучения команда исследователей из Калифорнийского университета в Сан-Диего вычислила пользователей Twitter, занимающихся незаконной продажей опиоидных анальгетиков. Об этом сообщает интернет-издание N+1 со ссылкой на описывающую метод статью, которая вышла в журнале American Journal of Public Health.
Алгоритмы машинного обучения позволяют исследователям работать с большим массивом данных, выявляя порой неочевидные на первый взгляд связи. Очень часто объектом анализа выступают посты пользователей в социальных сетях. Системы искусственного интеллекта позволяют не только выявить определенные закономерности в поведении людей в интернете, но и вычислить тех, кто нарушает закон или правила конкретного сообщества, например Facebook.
В 2008 году, спустя несколько лет после смерти 18-летнего Райана Хейта от передозировки викодином, конгресс США выпустил акт, запрещающий распространять в интернете не подлежащие свободному обращению вещества. Авторы новой работы использовали машинное обучение, чтобы найти твиты с сообщениями об онлайн-продаже опиоидных анальгетиков. С помощью специального сервиса они в течение полугода отбирали посты в твиттере, содержащие названия опиодных: "перкоцет", "фентанил", "викодин", "оксиконтин", "оксикодон" и "гидрокодон". В выборку попало почти 620 тысяч записей.
На следующем этапе ученые использовали алгоритм BTM, умеющий определять темы коротких текстов, чтобы отобрать твитты, связанные с продажей лекарств. Благодаря этому число постов в выборке сократилось до 1778, причем 90 процентов из них содержали ссылку на онлайн-магазин. Проверка показала, что примерно 46 процентов ссылок были рабочими и позволяли совершить нелегальную покупку в сети. Исследователи смогли выделить семь отдельных URL-адресов, принадлежавших нескольким аптекам, которые использовали блоги и соцсети для продажи, а также рекламным сайтам. Часть магазинов находилась в Пакистане.