Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

77 байт добавлено, 13:53, 21 января 2021
Архитектура
[[file:tfn_arch.png|800px|left|thumb|Рисунок 4 {{---}} Архитектура TextFuseNet]]
<br clear=all>
Общая архитектура TextFuseNet представлена выше (см. Рисунок 4). В качестве основы для FPN <ref name="fpn"/> используется ResNet, на этом этапе извлекаются общие признаки. Выходные данные используются RPN (Region Proposal Network)<ref name="rpn"/> и ветвью Semantic Segmentation. RPN <ref name="rpn"/> используется для генерации предполагаемых текстовых областей, что используется в последующих ветках Detection и Mask.
*Сначала в ветви Semantic Segmentation с помощью сегментации определяются признаки на глобальном уровне.
*Далее в ветви Detection, извлекаются признаки на словесном уровне и объединяются с признаками глобального уровня. Полученное представление используется для регрессии окружающей рамки и классификации объектов (текста/букв).
238
правок

Навигация