Алгоритм распознавания лиц силовиков под масками пока не готов - разработчик
Алгоритм, который позволяет идентифицировать силовиков, участвовавших в разгоне протестующих в Беларуси, еще не готов. В этом в разговоре с "Медузой" признался разработчик алгоритма Андрей Максимов.
По его словам, некоторые примеры, которые использовались в ролике-демонстрации, не были результатом работы алгоритма. Это было заимствование из канала "Каратели Беларуси Архив". Как отмечает "Медуза", алгоритм допускал те же ошибки, что и создатели этого Telegram-канала. Сам же алгоритм пока не готов, и неизвестно, сколько времени понадобится на его доработку, признается Максимов.
"Мы не собирались так быстро показывать свой проект, но из-за внезапной инаугурации [Лукашенко] и из-за эскалации уровня насилия перед нами встал непростой выбор - и он был сделан в пользу того, чтобы в спешном порядке продемонстрировать то, что у нас есть. Нам захотелось поставить силовиков на учет - дать им понять, что все технологии, которые нужны, чтобы их идентифицировать, существуют и что со временем их полная идентификация неизбежна", - рассказал разработчик.
Двое собеседников "Медузы", которые работают на российском рынке распознавания, заявили о том, что в видео не показано никаких доказательств того, что за ним стоит работа алгоритма, который хотя бы находится на стадии разработки.
Недавнее исследование, проведенное Национальным институтом стандартов и технологий США (NIST), показало, что из-за масок, которые люди вынуждены носить во время пандемии коронавируса, алгоритмы распознавания лиц начали ошибаться чаще. Но разработчики быстро внесли в них необходимые изменения, в результате чего у передовых компаний уровень эффективности достиг 90% даже если лицо скрыто маской. Главное, чтобы были видны хотя бы небольшая часть носа и глаза.
Поэтому задача, которая стоит перед алгоритмом Максимова, решаема. Но ролик, опубликованный разработчиком, напоминает нарезку кадров из художественного фильма.
"Настоящие алгоритмы так не работают, как в этом ролике показано. Например, [в демонстрации Максимова] там справа мелькают фотографии, которые алгоритм якобы „перебирает" [перед тем, как определиться с идентификацией]. Это совершенно нереалистично: сейчас алгоритм поиска по базе данных работает с такой огромной скоростью, что задача вывода каких-то промежуточных результатов на экран сожрет все мощности - и система перестанет искать и будет заниматься только иллюстрацией мелькания на экране", - рассказал Иван Шапшал, заместитель генерального директора компании „Папилон", занимающейся разработкой биометрических систем.
Он также отметил, что в ролике есть пример распознавания лица, который в современных условиях совершить невозможно. Одного из силовиков алгоритм распознает, несмотря на то, что видно только его ухо и часть щеки.
Максимов признался, что включил в ролик пример технологически нереализуемого распознавания, чтобы оказать психологическое давление на силовиков. "Главная цель этого видео - коммуникация с работниками силовых структур, у которых технические знания довольно ограничены. И если нам надо добавить какие-то вещи, которые продемонстрируют силовикам, что в нашей базе много их лиц и имен, то мы это добавим исключительно с этой целью", - заявил он.
Максимов также рассказал, что самая большая проблема, которая стоит перед его проектом, - нехватка данных. Всего разработчикам удалось собрать из СМИ и соцсетей около тысячи фотографий, которые пользователи считают фотографиями силовиков (обычно нейросети обучают на значительно большем количестве изображений); на снимках людей в масках алгоритм также не тренировали, признает Максимов. "Пока нет большого датасета с людьми в масках и без масок - нам эти данные еще собирать и собирать. У МВД Беларуси, к сожалению, нет странички в Facebook, куда были бы выложены по три фотографии каждого сотрудника, [снятые] с разных сторон", - жалуется разработчик.
Пока система идентификации не готова, Максимов решил сосредоточиться на визуализации деанонимизаций, которые уже совершили активисты. "Мы начнем возвращать лица людей, которые совершают преступления, на фотографии с их преступлениями. Снабжать людей качественной визуальной информацией - это тоже важно. Чтобы не было разобщения двух визуальных рядов, а то у нас пока получается, что какие-то неизвестные в масках избивают людей и выдергивают женщинам волосы - а на других снимках тот же человек кружится в поле одуванчиков со своей собакой", - заявил он.