Microsoft запустил сервис распознавания изображений, который учится на собственных ошибках
Microsoft продолжает активно работать над алгоритмами распознавания изображений. На недавно прошедшей ежегодной конференции Microsoft Build был анонсирован новый проект компании под названием CaptionBot. Это сайт, на который можно загрузить картинку или фотографию и получить текстовое описание того, что на ней изображено. Сайт разработан Microsoft Cognitive Services - отделом компании, который до этого работал над технологиями, использующиеся на HowOld.net и TwinorNot.com.
Для распознавания изображений сайт использует Computer Vision API, Emotion API и Bing Image API. На данный момент некоторые фотографии и картинки получают уверенные и конкретные описания, совпадающие с действительностью, а другие бот распознает настолько неточно, что доходит до комичных ситуаций. Иногда алгоритм и вовсе не может описать изображение.
Как было и со многими другими сервисами Microsoft, основанными на работе с облаками, сайт CaptionBot создан для обучения и анализа собственных ошибок, что в итоге должно привести к повышению точности и подробности описаний картинок. Оценить возможности новой технологии можно на сайте CaptionBot.