Российские разработчики обучили искусственный интеллект сурдопереводу
Разработчики сервиса "SOL Surdo-Online" для улучшения качества общения с глухими людьми представили новое решение, где переводчиком является уже не человек, а искусственный интеллект.
Сам сервис представляет из себя видеоконференцию между человеком с ограничением по слуху, услугодателем и посредником - переводчиком русского жестового языка. Разработчики хотят оснастить своей платформой как можно больше общественных мест в России и за рубежом, чтобы глухие люди находились в равных условиях с остальными при получении информации и услуг. Сервис уже используется в некоторых аэропортах, аптечных сетях и диагностических медицинских центрах.
"В России проживают приблизительно 200 тысяч глухих и миллион слабослышащих людей - носителей жестового языка. Их возможности коммуникации с внешним миром сведены до минимума, а государство предоставляет только 40 часов бесплатного сурдоперевода. С помощью онлайн-платформы, на которой работают переводчики, можно повысить эффективность перевода как минимум в пять раз. Так родилась идея проекта "Surdo-Online", который мы запустили в сентябре 2016 года. Теперь же мы решили усовершенствовать систему с помощью внедрения искусственного интеллекта", - пояснил основатель проекта Алексей Мельник.
Сейчас сервис работает по следующей схеме: компаниям предоставляется доступ к облачному сервису, где онлайн в видеорежиме можно связаться с сурдопереводчиками. С ними глухие люди объясняются на жестовом языке, после чего переводчики передают информацию услугодателям и наоборот. Сервис работает через обычный Google Chrome браузер. То есть к нему подключается любой планшет или компьютер, а инфраструктурные затраты сокращаются практически до нуля.
Однако к концу 2018 года разработчики планируют выпустить пилотный прототип видеоплатформы, где искусственный интеллект используется для распознавания жестов. То есть программа сможет самостоятельно общаться с глухими людьми без помощи переводчиков. Распознавать жесты она будет при помощи обученной нейронной сети. Благодаря многочисленным видеоконференциям с участием носителей жестового языка сейчас собирается база жестов - датасет. На каждый из них нужно как минимум по 1000 записей от разных людей. А общий словарный запас русского жестового языка составляет более 10 000 жестов. Основная сложность заключается в объемности жестов - это 3D-язык, который нужно оцифровать, чтобы процесс перевода стал полностью автоматизированным.
26-27 сентября команда приняла участие в международной конференции EdCrunch, где проект оценили зарубежные эксперты. По словам Питера Чайлдса (Peter Childs), директора программы Innovation Design Engineering из Великобритании, "SOL Surdo-Online" - это реалистичный проект, который уже имеет функционирующий прототип устройства. Проект еще нуждается в инвестициях и советах, но уже демонстрирует высокий потенциал даже на международном уровне.