Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

26 байт добавлено, 13:38, 21 января 2021
Архитектура
<br clear=all>
Общая архитектура TextFuseNet представлена выше (см. Рисунок 4). В качестве основы для FPN используется ResNet, на этом этапе извлекаются общие признаки. Выходные данные используются RPN и ветвью Semantic Segmentation. RPN используется для генерации предполагаемых текстовых областей, что используется в последующих ветках Detection и Mask.
*В Сначала в ветви Semantic Segmentation с помощью сегментации определяются признаки на глобальном уровне.*В Далее в ветви Detection, извлекаются признаки на словесном уровне и объединяются с признаками глобального уровня. Полученное представление используется для регрессии окружающей рамки и классификации объектов (текста/букв).*В Потом в ветви Mask извлекаются признаки на символьном уровне. После все Все три уровня признаков (символьный, словесный и глобальный) объединяются, и полученное представление используется при сегментации экземпляров (instance segmentation) для объектов, полученных в ветви Detection.Для объединения При объединении признаков используется модуль Multi-Path Fusion, общая схема работы которого представлена ниже (Рис. 5):
<br clear=all>
238
правок

Навигация