Изменения

Перейти к: навигация, поиск

Известные наборы данных

29 байт убрано, 02:04, 12 января 2021
ICDAR
[[Файл:ICDAR2017.png|мини|Пример изображения из датасета ICDAR2017 Competition on Multi-lingual Scene Text Detection and Script Identification (MLT) [https://arxiv.org/pdf/1812.05219.pdf источник]]]
===Описание===
ICDAR<ref>https://rrc.cvc.uab.es/</ref> (англ. International Conference on Document Analysis and Recognition) {{---}} это международная конференция по анализу и распознаванию текста и одноименное семейство набора данных, состоящее из фотографий, на которых изображен текст на разных языках. Данные наборы создаются для соревнований ICDARRRC (англ.Robust Reading Competition), где требуется решить следующие задачи: обнаружение текста, сегментация текста, распознавание символов, сквозное распознавание.
Ниже приведен анализ наборов данных ICDAR2013, ICDAR2015, ICDAR2017, ICDAR2019.
! Количество слов
! Язык текста на изображениях
! Размер изображений
! Задачи
|-
| 5003, из них обучающий набор из 3564 слов и тестовый набор из 1439 слов
| Английский
| 100х100px
| обнаружение текста, сегментация текста, распознавание символов
|-
| 1943, из них обучающий набор из 848 слов и тестовый набор из 1095 слов
| Английский
| 100х100px
| обнаружение текста, сегментация текста, распознавание символов
|}
|[[Файл:ICDAR203Scene.png |600px|thumb|Сэмпл из датасета ICDAR2013 "Focused Scene Text"]]
|}
 
==См.также==
61
правка

Навигация