Алгоритм от Amazon научился распознавать курсивный текст
Алгоритм от Amazon научился распознавать курсивный и не горизонтально расположенный текст. Точность системы составила рекордные 83,65%.
Исследователи несколько лет пытались создать алгоритм, который будет с высокой точностью распознавать не горизонтально расположенные символы. Теперь инженеры из Amazon разработали TextTubes - это детектор искривленного текста.
Алгоритм считывает текст в два шага - сначала обнаруживает и определяет его последовательность, а затем распознает. Для первой задачи TextTubes локализует символы, потом, с помощью контекстных подсказок, определяет, как правильно его читать, а затем - расшифровывает содержание. Основная сложность - в деформации текста и произвольных шрифтах.
Исследователи оценили производительность TextTubes на CTW-1500 - наборе данных, состоящем из 1500 изображений, собранных из стоковых библиотек. На них есть более 10 тыс. текстов, содержащих, по крайней мере, одно слово, написанное не строго по горизонтали. Кроме того, массив содержал примерно 1255 учебных изображений и 300 тестовых изображений с одним или несколькими изогнутыми текстами. Ученые сообщили, что они достигли лучших результатов в отрасли - 83,65% удачных случаев распознавания.