Новый сервис Microsoft распознает настроение на фотографии
Microsoft объявил об обновлении функционала Project Oxford, ряда веб-сервисов, помогающих разработчикам создавать интеллектуальные приложения с функциями вроде распознания лиц или возраста.
Еще весной на конференции Microsoft Build компания пообещала, что в рамках Project Oxford будут проведено огромное количество исследований в области машинного обучения. С таким объемом работы не может справиться небольшая компания. Но Microsoft имеет достаточно вычислительной мощности для выполнения наиболее сложных задач. Благодаря этому, она может помочь небольшим разработчикам создавать необычные сервисы, с которыми малые стартапы никогда не справились бы собственноручно, пишет Business Insider.
Обновления, анонсированные на британской конференции Future Decoded, дополнят Project Oxford целым рядом новых возможностей. Речь идет о распознавании речи на оживленных улицах и стадионах, распознавании лица человека во время разговора, стабилизации видео и проверки правописания.
Но главная новая возможность - улучшенный сервис распознавания лиц. Теперь система может взглянуть на фотографию и сказать, какие эмоции испытывает запечатленный на нем человек, распределив их по шкалам вроде счастья, злости или отвращения.
Вот как выглядит работа этого сервиса.
Сейчас на сайте Project Oxford доступна простая демо-версия, которая позволяет любому пользователю загрузить свое фото и посмотреть, как сервис справится с распознавание эмоции. Если на снимке запечатлено несколько человек, сервис определит эмоции каждого.
Конечная цель Project Oxford состоит в том, чтобы позволить разработчикам создавать собственные приложения с использованием служб Microsoft. Для интеграции служб Project Oxford в приложение используется интерфейс прикладного программирования (API). Само же приложение может выполнять собственные задачи.
К примеру, программисты могут создать приложение для iPhone, которое позволит пользователю найти все фотографии, где человек запечатлен со счастливым выражением лица. Или, напротив, можно создать фильтр для социальной сети, который не будет выводить изображения печальных людей.
Сервис распознавания эмоций может найти применение и в бизнесе. К примеру, компании, занимающиеся исследованием рынка, могут создать программное обеспечение, которое будет анализировать снимки людей сделанные, как вариант, во время просмотра рекламы. Это позволит точно определять реакцию фокус-группы.
"Сейчас люди анализируют настроения аудитории на основании текстовых опросов, а не непосредственных данных", - говорит Райан Галгон, старший программный менеджер Microsoft Research.
Другие новые возможности Project Oxford также имеют большой потенциал для создания умных приложений.
Редактирование видео
Видео функции, которые станут доступны для разработчиков до конца года, позволят автоматически редактировать видеоролики. К примеру, обрезать видео, оставляя только те фрагменты, на которых двигаются люди. Также станет доступна возможность стабилизации - система сможет компенсировать дрожание рук.
Распознавание говорящего
Функция распознавания говорящего человека также станет доступна к концу декабря. Она может использоваться службами безопасности предприятий. Новая система CRIS (Custom Recognition Intelligent Service) также может распознавать речь в оживленных и шумных местах. Правда, эта возможность будет доступна только по приглашениям и в режиме бета-теста.
Проверка правописания
Одной из самых удачных и полезных новых функций является проверка правописания. По словам Галгона, ни один из существующих на данный момент сервисов распознавания правописания не является достаточно умным. К примеру, название известной компании Lyft вообще не распознается как слово. Но новая служба Microsoft позволяет постоянно наполнять словарь новыми словами и сленговыми выражениями. Разработчики, в свою очередь, смогут встраивать постоянно обновляемый сервис в свои приложения. Это означает, что вскоре появится много по-настоящему умных словарей.
Райан Галгон утверждает, что при разработке данной службы его подразделение активно сотрудничало с отделом разработки Microsoft Office. Это означает, что в ближайшем будущем мы можем увидеть более умную проверку правописания в Microsoft Word.