Искусственный интеллект научился распознавать "пьяные" твиты
Ученые разработали систему машинного обучения, способную вычислять твиты, написанные в состоянии алкогольного опьянения.
Команда исследователей из Рочестерского университета в течение года собирала отмеченные геотегами твиты из Нью-Йорка и округа Монро. Затем они отфильтровали твиты, в которых упоминался алкоголь и слова, к нему относящиеся, например пиво, вечеринка, пьяный.
После этого с помощью сервиса Amazon's Mechanical Turk исследователи проанализировали информацию более детально. Их интересовала, выпивал ли непосредственно автор сообщения и был ли он пьян в момент его публикации. Всего в выборку попало 11 тыс. твитов. Дальнейший анализ твитов включал поиск в записях или геотегах слов, которые относятся к дому, например диван, телевизор, ванна. Кроме того, учитывалось и время написания твита.
Весь массив данных исследователи загрузили в машину опорных векторов. В конечном итоге машина научилась определять, когда человек пишет "пьяные" твиты, а также смогла составить целую карту наиболее популярных мест для употребления алкоголя. Также планируется, что машина впоследствии научится определять пол и возраст автора "пьяного" твита.