238
правок
Изменения
→Text Perceptron (2020)
==== Точность ====
=== Text Perceptron TextPerceptron (2020) ===
==== Краткое описание и особенности : ====Text Perceptron - это E2E модель, состоящая из трёх частей: модуль детекции, Shape Transform Module (STM, "модуль трансформации формы") и модуль распознавания текста. Модуль детекции описывает текстовую область с помощью четырёх субобластей: центр, начало, конец и вертикальная (верх/низ) область. Это сделано для упрощения определения направления чтения. STM необходим для устранения несовместимости между модулем детекции и модулем распознавания. Модуль распознавания генерирует итоговую символьную последовательность. Каждый этап может влиять на предшествующий ему этап, сигнализируя соответствующему модулю о необходимости дополнительной настройки.[[Файл:Tperc sch.png|400px]]
==== Архитектура : ====Детектор текста использует ResNet и Feature Pyramid Network (FPN) как основу, и реализуется путем одновременного изучения трех задач: многоклассовой семантической сегментации с учетом порядка, регрессии угла и регрессии смещения границ. STM отвечает за объединение детекции и распознания. Для этого STM генерирует доверительные точки и настраивает их позиции, на основе чего "выпрямляет" текст с помощью TPS (Thin-plate splines) для дальнейшего распознавания. В модуле распознавания может использоваться любой sequence-based метод.[[file:Tperc arch.png|800px]]
==== Точность : ====F-мера:*Total-Text (Detection): 85.2%*Total-Text (E2E, без словаря): 69.7%*Total-Text (E2E, со словарём): 78.3%
=== ASTS_Weakly (2019) ===