Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

2047 байт добавлено, 21:29, 18 января 2021
Boundary (2019)
<br clear=all>
=== Boundary (20192020) === [[Файл:Bound stgs.png|500px|thumb|right]]
==== Краткое описание и особенности ====
Boundary при детекции использует граничные точки, чтобы максимально точно повторить контуры текстовой области. После, используя граничные точки, текст выравнивают (приводят к виду, подходящему для распознающего модуля). Перед определением граничных точек заранее определяются "коробки", в которых может находиться текст.
 
<br clear=all>
 
[[Файл:Bound arch.png|800px|thumb|right]]
==== Архитектура ====
Boundary состоит из трёх частей: определение ориентированной "коробки" текста, определение граничных точек и распознавание текста. Сначала строится карта признаков с помощью ResNet-50 и FPN (Feature Pyramid Network). После используется RPN чтобы сгенерировать предполагаемые горизонтально-ориентированные области. После этого для каждой области генерируется ориентированная "коробка" через предсказывание её центральной точки, высоты, ширины и направления. Далее для каждой ориентированной коробки ищутся граничные точки, для чего используется Boundary Point Detection Network (BPDN). Опираясь на полученные граничные точки, предполагаемые области выравнивают, после чего для распознавания текста используется CRNN.
==== Точность ====
F-мера:
*Total-Text (Detection): 87.0%
*Total-Text (E2E, без словаря): 64.1%
 
<br clear=all>
238
правок

Навигация