Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

104 байта добавлено, 23:19, 20 января 2021
Boundary (2020)
=== Boundary (2020) ===
[[Файл:Bound stgs.png|500px|thumb|right|Рисунок 22 {{---}} Стадии работы Boundary]]Boundary при детекции использует граничные точки, чтобы максимально точно повторить контуры текстовой области. После, используя граничные точки, текст приводится к виду, подходящему для распознающего модуля. Перед определением граничных точек заранее определяются "коробки", в которых может находиться текст(см. Рисунок 22).
<br clear=all>
[[Файл:Bound arch.png|800px|thumb|right|Рисунок 23 {{---}} Архитектура Boundary]]
==== Архитектура ====
Boundary состоит из трёх частей: определение ориентированной "коробки" текста, определение граничных точек и распознавание текста(см. Рисунок 23). Сначала строится карта признаков с помощью ResNet50<ref name="resnet"/> и FPN<ref name="fpn"/>. После используется RPN чтобы сгенерировать предполагаемые горизонтально-ориентированные области. После этого для каждой области генерируется ориентированная "коробка" через предсказывание её центральной точки, высоты, ширины и направления. Далее для каждой ориентированной коробки ищутся граничные точки, для чего используется Boundary Point Detection Network (BPDN). Опираясь на полученные граничные точки, предполагаемые области выравнивают, после чего для распознавания текста используется CRNN.
==== Точность ====
94
правки

Навигация