Переводчик Google уличили в сексизме
Бразильские исследователи в некоторых своих работах готовы обскакать коллег из Британии. Так, ученые из Федерального университета Риу-Гранди-ду-Сул решили проверить, насколько гендерно непредвзятым является сервис Google Translate. Для этого они отобрали предложения с языка без грамматической категории рода и перевели их на английский. Google Translate уже сам решал, на женский или мужской род заменить гендерно-нейтральное местоимение третьего лица, пишет N+1.
Всего было выбрано 12 языков, в которых отсутствует грамматическая категория рода. Например, в эстонском и «он», и «она» переводятся как «ta». Предложения на этих языках строились по формуле «X является Y». X - это местоимение третьего лица, а Y - существительное, выражающее профессию (врач, программист). Всего было использовано 1019 таких существительных.
Ученые заметили, что фразы про медсестру/медбрата Google Translate переводил предпочтительно в женском роде: «she is a nurse». Тогда как во фразе про ученого предпочел указать мужской пол: «he is a scientist». В итоге получилось, что в 71% случаев представителей технических профессий относили к мужскому роду, в 4% - к женскому, в остальных - к среднему.
Сопоставление результатов с реальными цифрами распределения профессий по гендерному признаку по официальной статистике показало, что Google Translate действительно предвзят. Хорошо, что он/она - всего лишь алгоритм, а значит, пока судебные разбирательства ему/ей не грозят.