Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

26 байт добавлено, 19:05, 20 января 2021
Архитектура
==== Архитектура ====
[[Файл:Ts pip.png|500px|right|thumb|Схема работы TextSnake]]
Схема работы TextSnake представлена справа. TextSnake использует [[:Сверточные_нейронные_сети|свёрточную нейронную сеть]]. Чтобы определять текст произвольной формы, используется FCN (Fully Convolutional Network) модель для предсказывания геометрических атрибутов текстовых областей. С помощью FCN и FPN(Feature Pyramid Network)<ref name="fpn">[https://arxiv.org/pdf/1612.03144.pdf Lin, T.Y., Dollar, P., Girshick, R., He, K., Hariharan, B., Belongie, S., "Feature pyramid networks for object detection"]</ref> предсказываются вероятностные карты центральной линии (text center line, TCL) и текстовых областей (text regions, TR), вместе с геометрическими атрибутами <math>r, cosθ, sinθ</math>. Карта TCL в дальнейшем маскируется картой TR (TCL, по сути, является частью TR). Далее извлекаются списки точек центральной оси и восстанавливаются экземпляры текста. Детальная архитектура представлена ниже:
[[file:TextSnakeArchitecture.png|500px|left|thumb|Архитектура TextSnake]]
238
правок

Навигация