Изменения

Перейти к: навигация, поиск

Распознавание изогнутого текста

5060 байт добавлено, 21:31, 21 января 2021
Сводные таблицы
{| class="wikitable"
|+ Сводная таблица точности по результатам Общие результаты детекции на наборе данных TotalTextTotal-Text
|-
! Модель !! Precision !! Recall !! F-мера
{| class="wikitable"
|+ Сводная таблица Общие результаты E2E моделей на наборе данных Total-Text|-! Модель !! F-мера без словаря !! F-мера со словарем|-| style="background:#eaecf0;" | '''CRAFTS''' || 78.7 || -|-| style="background:#eaecf0;" | '''MANGO''' || 72.9 || 83.6|-| style="background:#eaecf0;" | '''Text Perceptron''' || 69.7 || 78.3|-| style="background:#eaecf0;" | '''Boundary''' || 65.0 || 76.1|-| style="background:#eaecf0;" | '''Mask TextSpotter''' || 52.9 || 71.8|-|}  {| class="wikitable"|+ Общие результаты моделей для распознавания
|-
! Модель !! F-мера на наборе ICDAR'15<ref name="icdar15"/> !! F-мера на наборе данных CUTE80<ref name="cute"/>
{| class="wikitable"
|+ Сводная таблица точности E2E моделей на наборе данных TotalTextдля детекции
|-
! Модель !! FОсобенности !! Реализация|-мера без словаря | style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''TextSnake'''</p>| style="width: 400px;" | <p style="text-align:center;">Представление области текста с помощью центральной линии и множества дисков.</p>[[Файл:Ts textreg.png|300px|center]]| style="width: 200px;" | <p style="text-align:center;"></p>|-| style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''TextFuseNet'''</p>| style="width: 400px;" | <p style="text-align:center;">Выделение признаков на глобальном, словесном и символьном уровнях. Представление области текста с помощью маски.</p>[[Файл:Tfn textreg.png|300px|center]]| style="width: 200px;" |<p style="text-align:center;"></p>|-| style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''PolyPRNet'''</p>| style="width: 400px;" | <p style="text-align:center;">Представление текста с помощью скелета из полиномиальной центральной линии и линий широты.</p>[[Файл:Polyprn textreg.png|300px|center]]| style="width: 200px;" | <p style="text-align:center;"></p>|-|}  {| class="wikitable"|+ Сводная таблица моделей E2E|-! Модель !! FОсобенности !! Реализация|-| style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''Mask TextSpotter'''</p>| style="width: 400px;" | <p style="text-align:center;">Одна из первых моделей, способных определить и распознать изогнутый текст. Представление области текста с помощью маски.</p>[[Файл:Mts_textreg.png|300px|center]]| style="width: 200px;" | <p style="text-align:center;"></p>|-| style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''CRAFTS'''</p>| style="width: 400px;" | <p style="text-align:center;"></p>[[|300px|center]]| style="width: 200px;" | <p style="text-align:center;"></p>|-| style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''TextPerceptron'''</p>| style="width: 400px;" | <p style="text-align:center;">Shape Transform Module, использующий для выпрямления доверительные точки на границах текстовых областей. Взаимодействие модулей друг с другом в обе стороны.</p>[[Файл:Textperc textreg.png|300px|center]]| style="width: 200px;" | <p style="text-align:center;"></p>|-| style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''Boundary'''</p>| style="width: 400px;" | <p style="text-align:center;">Нанесение граничных точек при представлении текста. Использование граничных точек для выпрямления.</p>[[Файл:Boundary.png|300px|center]]| style="width: 200px;" | <p style="text-мера со словаремalign:center;"></p>
|-
| style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''CRAFTSMANGO''' </p>|style="width: 400px;" | 78<p style="text-align:center;">Однослойная архитектура, сочетающая детекцию и распознавание. Элементы распознавания на этапе детекции. Для распознавания создан легковесный инструмент.7 </p>|style="width: 200px;" | <p style="text-align:center;"></p>
|-
| style}   {| class="background:#eaecf0;wikitable" | '''MANGO''' || 72.9 || 83.6+ Сводная таблица моделей распознавания
|-
| style="background:#eaecf0;" | '''Text Perceptron''' || 69.7 || 78.3! Модель !! Особенности !! Реализация
|-
| style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''BoundaryMORAN''' </p>|style="width: 400px;" | 65<p style="text-align:center;">Разбиение изображения на части, определение смещения каждой части изображения. Выпрямление изображения на основе предсказанных смещений.0 </p>[[Файл:Moran morn.png|300px| 76.1center]]| style="width: 200px;" | <p style="text-align:center;"></p>
|-
| style="background:#eaecf0;width:100px" | <p style="text-align:center;">'''Mask TextSpotterESIR''' </p>|style="width: 400px;" | 52<p style="text-align:center;">Представление области текста с помощью скелета из полиномиальной центральной линии и дополнительных параметров (высота, ориентация). Итеративное выпрямление текста на основе просчитанных параметров.9 </p>[[Файл:Esir line.png|300px| 71.8center]]| style="width: 200px;" | <p style="text-align:center;"></p>
|-
|}
238
правок

Навигация