Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

22 байта добавлено, 22:25, 21 января 2021
TextFuseNet (2020)
[[file:tfn_arch.png|800px|left|thumb|Рисунок 4 {{---}} [https://www.ijcai.org/Proceedings/2020/0072.pdf Архитектура TextFuseNet]]]
<br clear=all>
Общая архитектура TextFuseNet представлена выше (см. Рисунок 4). В качестве основы для FPN<ref name="fpn"/> используется ResNetResNet50<ref name="resnet"/>, на этом этапе извлекаются общие признаки. Выходные данные используются RPN (Region Proposal Network)<ref name="rpn"/> и ветвью Semantic Segmentation. RPN<ref name="rpn"/> используется для генерации предполагаемых текстовых областей, что используется в последующих ветках Detection и Mask.
*Сначала в ветви Semantic Segmentation с помощью сегментации определяются признаки на глобальном уровне.
*Далее в ветви Detection, извлекаются признаки на словесном уровне и объединяются с признаками глобального уровня. Полученное представление используется для регрессии окружающей рамки и классификации объектов (текста/букв).
94
правки

Навигация