61
правка
Изменения
→ICDAR
===ICDAR 2019===
'''ICDAR 2019 "COCO-Text"''' {{---}} набор данных, основанный на датасете "MS COCO"<ref>https://vision.cornell.edu/se3/wp-content/uploads/2019/01/ICDAR2017b.pdf</ref>, где собраны обычные изображения ежедневных сцен, на которых, возможно, есть текст. Текст на изображениях на английском, немецком, французском и других языках. Датасет предназначен для следующих задач оптического распознавани символов: сквозное распознавание.
'''ICDAR 2019 "Multi-lingual Scene Text"''' {{---}} набор данных, где собраны изображения с текстом на 10 языках. Текст на изображениях на арабском, английском, деванагари, немецком, бенгальском, китайском, японском, французском, корейском языках. Датасет предназначен для следующих задач оптического распознавани символов: обнаружение текста, идентификация скрипта, сквозное распознавание.
'''ICDAR 2019 "Scene Text Visual Question Answering"''' {{---}} набор данных, включающий 23 038 изображений с 31 791 парой вопросов и ответов, где ответ всегда основан на присутствующих текстовых экземплярах на изображении. Текст на изображениях на янглийском языке. Датасет предназначен для следующих задач оптического распознавани символов: ответ на вопрос, связанный с изображением.
{| class="wikitable"
|-
! Наименование датасета
! Количество объектов
! Количество обучающих объектов
! Количество обучающих слов
! Количество тестовых слов
|-
| ICDAR 2019 "COCO-Text"
| 63686
| 43686
| -
| -
|-
| ICDAR 2019 "Multi-lingual Scene Text"<ref>https://arxiv.org/pdf/1907.00945.pdf</ref>
| 20 000 (2 000 для каждого языка) + 277 000 сгенерированных изображения
| 10 000
| -
| -
|-
| ICDAR 2019 "Scene Text Visual Question Answering"
| набор данных, включающий23 038 изображений с 31 791 парой вопросов и ответов,где ответ всегда основан на присутствующих текстовых экземплярахна изображении.
| -
| -
| -
| -
|}
{|align="center"
|-valign="top"
|[[Файл:ICDAR2019Sample.png |600px|thumb|Рисунок 23. Сэмпл из датасета ICDAR 2019 "Scene Text Visual Question Answering"]]
|}