Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

37 байт добавлено, 21:57, 17 января 2021
Архитектура
==== Архитектура ====
PolyPRNet использует двухступенчатую структуру на основе R-CNN. Схема архитектуры представлена ниже.
На первой стадии используется ResNet50 и Feature Pyramid Network (FPN), чтобы получить карты признаков из исходного изображения. Далее используется сеть RPN для формирования набора предложенных областей текста. На второй стадии используется модуль R-CNN с регрессией ветками регрессии границы (bounding box regression) и классификациейклассификации, чтобы точнее локализовать предложенные области. Так же используется модуль Polynomialbased shape Parameter Regression (PPR), чтобы вывести форму и направление потенциального текстового кандидата.
[[file:Pprnet arch.png|800px]]
238
правок

Навигация