Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

22 байта убрано, 21:56, 17 января 2021
Архитектура
==== Архитектура ====
PolyPRNet использует двухступенчатую структуру на основе R-CNN. Схема архитектуры представлена ниже.
На первой стадии используется ResNet50 и Feature Pyramid Network (FPN), чтобы получить карты признаков из исходного изображения. Далее используется сеть RPN для формирования набора предложенных областей текста. На второй стадии используется модуль R-CNN с веткой регрессии регрессией границы и веткой классификацииклассификацией, чтобы точнее локализовать предложенные области. Так же используется модуль Polynomialbased shape Parameter Regression (PPR), чтобы вывести форму и направление потенциального текстового кандидата.
[[file:Pprnet arch.png|800px]]
238
правок

Навигация