Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

7 байт добавлено, 18:46, 18 января 2021
Архитектура:
==== Архитектура: ====
 
[[file:Tperc arch.png|800px|right|thumb]]
 
Детектор текста использует ResNet и Feature Pyramid Network (FPN) как основу, и реализуется путем одновременного изучения трех задач: многоклассовой семантической сегментации с учетом порядка, регрессии угла и регрессии смещения границ. STM отвечает за объединение детекции и распознания. Для этого STM генерирует доверительные точки и настраивает их позиции, на основе чего "выпрямляет" текст с помощью TPS (Thin-plate splines) для дальнейшего распознавания. В модуле распознавания может использоваться любой sequence-based метод.
 
[[file:Tperc arch.png|800px|right]]
==== Точность: ====
238
правок

Навигация