238
правок
Изменения
→Архитектура
==== Архитектура ====
[[Файл:Ts pip.png|500px|right|thumb|Схема работы TextSnake]]
Схема работы TextSnake представлена справа. TextSnake использует [[:Сверточные_нейронные_сети|свёрточную нейронную сеть]]. Чтобы определять текст произвольной формы, используется FCN модель для предсказывания геометрических атрибутов текстовых областей. С помощью FCN и FPN предсказываются вероятностные карты центральной линии (text center line, TCL) и текстовых областей (text regions, TR), вместе с геометрическими атрибутами <math>r, cosθ, sinθ</math>. Карта TCL в дальнейшем маскируется картой TR (TCL, по сути, является частью TR). Далее пошагово извлекаются списки точек центральной оси и восстанавливаются экземпляры текста. Детальная архитектура представлена ниже:
[[file:TextSnakeArchitecture.png|500px|left|thumb|Архитектура TextSnake]]