Яндекс открыл Лабораторию Толоки для быстрой обработки данных
Заказчик только заполняет небольшую форму, дает ссылку на данные и объясняет, что с ними делать, и получает результаты разметки.
Лаборатория Толоки автоматически решает популярные задачи по обработке данных, для работы с ней не нужны никакие специальные знания. Заказчик только заполняет небольшую форму, дает ссылку на данные и объясняет, что с ними делать. Остальное - создание интерфейса, настройка проекта и поиск исполнителей - происходит с помощью автоматизированных процессов. Когда все будет готово, заказчик получит результаты разметки.
Сейчас Лаборатория выполняет три вида разметки данных - классификацию изображений, классификацию текста и выделение объектов на картинке.
Размеченные данные помогают решать самые разные задачи в маркетинге, продажах, образовании, машинном обучении и других сферах. Например, с помощью классификации изображений можно определить эмоции человека на снимке - смеется он, равнодушен или грустит. С помощью классификации текста - сгруппировать комментарии пользователей по тональности, скажем, разделить их на позитивные, негативные и нейтральные. А выделение областей изображений, помимо прочего, позволяет найти на фотографиях людей, которые выгуливают собаку. Позже появятся автоматические решения и для других видов задач.
«Мы стремимся, чтобы технологиями Толоки могли пользоваться как можно больше людей - и чтобы это было легко, - говорит руководитель Яндекс.Толоки Ольга Мегорская. - Если у человека есть такая возможность, он самостоятельно разберется в Толоке и запустит проект. Если задача сложная, а разбираться времени нет - обратится к сертифицированным партнерам. А со стандартными и наиболее популярными типами разметки поможет Лаборатория».
Заполнить заявку на обработку данных можно в Лаборатории. Минимальный объем задачи - 500 текстов или изображений, цена начинается с 12 000 рублей и зависит от сложности разметки.
Яндекс.Толока - это открытая краудсорсинговая платформа, где зарегистрировано более семи миллионов человек, которые выполняют задания по сбору и разметке данных для разных заказчиков. Каждый день исполнители выполняют больше 13 миллионов заданий по разметке данных, которые потом используются как эталонные данные для машинного обучения, а также помогают в задачах модерации и генерации контента.