Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

535 байт добавлено, 22:28, 21 января 2021
Сводные таблицы
| style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''TextSnake'''</p>
| style="width: 400px;" | <p style="text-align:center;">Представление области текста с помощью центральной линии и множества дисков.</p>[[Файл:Ts textreg.png|300px|center]]
| style="width: 200px;" | <p style="text-align:center;">FCN<ref name="fcn"/> + FPN<ref name="fpn"/></p>
|-
| style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''TextFuseNet'''</p>
| style="width: 400px;" | <p style="text-align:center;">Выделение признаков на глобальном, словесном и символьном уровнях. Представление области текста с помощью маски.</p>[[Файл:Tfn textreg.png|300px|center]]
| style="width: 200px;" |<p style="text-align:center;">ResNet50<ref name="resnet"/> + FPN<ref name="fpn"/> + Mask R-CNN<ref name="rcnn"/></p>
|-
| style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''PolyPRNet'''</p>
| style="width: 400px;" | <p style="text-align:center;">Представление текста с помощью скелета из полиномиальной центральной линии и линий широты.</p>[[Файл:Polyprn textreg.png|300px|center]]
| style="width: 200px;" | <p style="text-align:center;">ResNet50<ref name="resnet"/> + FPN<ref name="fpn"/> + RPN<ref name="rpn"/> + R-CNN<ref name="rcnn"/></p>
|-
|}
| style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''Mask TextSpotter'''</p>
| style="width: 400px;" | <p style="text-align:center;">Одна из первых моделей, способных определить и распознать изогнутый текст. Представление области текста с помощью маски.</p>[[Файл:Mts_textreg.png|300px|center]]
| style="width: 200px;" | <p style="text-align:center;">ResNet50<ref name="resnet"/> + RPN<ref name="rpn"/> + Fast R-CNN<ref name="rcnn"/></p>
|-
| style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''CRAFTS'''</p>
| style="width: 400px;" | <p style="text-align:center;">Состоит из трех слоев: детекции, коммуникации и распознавания. Слой коммуникации связывает слой детекции и распознавания и позволяет ошибке распознавания распространиться до слоя детекции. Текст представляется в трех видах: границы областей текста, границы символов и ориентированные границы символов.</p>[[Файл:CraftsText.png|300px|center]]
| style="width: 200px;" | <p style="text-align:center;">ResNet50<ref name="resnet"/></p>
|-
| style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''TextPerceptron'''</p>
| style="width: 400px;" | <p style="text-align:center;">Shape Transform Module, использующий для выпрямления доверительные точки на границах текстовых областей. Взаимодействие модулей друг с другом в обе стороны.</p>[[Файл:Textperc textreg.png|300px|center]]
| style="width: 200px;" | <p style="text-align:center;"> ResNet<ref name="resnet"/> + FPN<ref name="fpn"/></p>
|-
| style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''Boundary'''</p>
| style="width: 400px;" | <p style="text-align:center;">Нанесение граничных точек при представлении текста. Использование граничных точек для выпрямления.</p>[[Файл:Boundary.png|300px|center]]
| style="width: 200px;" | <p style="text-align:center;">ResNet50<ref name="resnet"/> + FPN<ref name="fpn"/> + RPN<ref name="rpn"/></p> + CRNN<ref name="crnn"/>
|-
| style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''MANGO'''</p>
| style="width: 400px;" | <p style="text-align:center;">Однослойная архитектура, сочетающая детекцию и распознавание. Элементы распознавания частично присутствуют уже на этапе детекции. На этапе распознавания остался лишь легковесный инструмент вместо полноценного слоя.</p>
| style="width: 200px;" | <p style="text-align:center;">ResNet50<ref name="resnet"/> + FPN<ref name="fpn"/></p>
|-
|}
94
правки

Навигация