Изменения

Известные наборы данных

527 байт добавлено, 21:26, 24 января 2021

→‎ICDAR

===ICDAR 2019===

'''ICDAR 2019 "COCO-Text"''' {{---}} набор данных, основанный на датасете "MS COCO"<ref>https://vision.cornell.edu/se3/wp-content/uploads/2019/01/ICDAR2017b.pdf</ref>, где собраны обычные изображения ежедневных сцен, на которых, возможно, есть текст. Текст на изображениях на английском, немецком, французском и других языках. Датасет предназначен для следующих задач оптического распознавани символов: сквозное распознавание.

'''ICDAR 2019 "Multi-lingual Scene Text"''' {{---}} набор данных, где собраны изображения с текстом на 10 языках. Текст на изображениях на арабском, английском, деванагари, немецком, бенгальском, китайском, японском, французском, корейском языках. Датасет предназначен для следующих задач оптического распознавани символов: обнаружение текста, идентификация скрипта, сквозное распознавание.

'''ICDAR 2019 "Scene Text Visual Question Answering"''' {{---}} набор данных, включающий 23 038 изображений с 31 791 парой вопросов и ответов, где ответ всегда основан на присутствующих текстовых экземплярах на изображении. Текст на изображениях на янглийском языке. Датасет предназначен для следующих задач оптического распознавани символов: ответ на вопрос, связанный с изображением.

{| class="wikitable"

|-

! Наименование датасета

~~! Тип текста~~

! Количество объектов

! Количество обучающих объектов

! Количество обучающих слов

! Количество тестовых слов

~~! Язык текста на изображениях~~

~~! Задачи~~

|-

| ICDAR 2019 "COCO-Text"

| набор данных, основанный на датасете "MS COCO"<ref>https://vision.cornell.edu/se3/wp-content/uploads/2019/01/ICDAR2017b.pdf</ref>, где собраны обычные изображения ежедневных сцен, на которых, возможно, есть текст

| 63686

| 43686

| -

~~| Французский~~

~~| сквозное распознавание~~

|-

| ICDAR 2019 "Multi-lingual Scene Text"<ref>https://arxiv.org/pdf/1907.00945.pdf</ref>

~~| изображения с текстом на 10 различных языках~~

| 20 000 (2 000 для каждого языка) + 277 000 сгенерированных изображения

| 10 000

| -

~~| Английский, Арабский, Бенгальский, Деванагари, Китайский, Французский, Немецкий, Японский, Корейский~~

~~| обнаружение текста, идентификация скрипта, сквозное распознавание~~

|-

| ICDAR 2019 "Scene Text Visual Question Answering"

| ~~набор данных, включающий~~23 038 ~~изображений с 31 791 парой вопросов и ответов,где ответ всегда основан на присутствующих текстовых экземплярахна изображении.~~

| -

~~| Английский~~

~~| ответ на вопрос, связанный с изображением~~

|}

~~{|align="center"~~

~~|-valign="top"~~

~~|[[Файл:ICDARSamples.png |600px|thumb|Рисунок 22. Сэмплы из датасетов ICDAR 2011, ICDAR 2015, ICDAR 2017]]~~

|}

{|align="center"

|-valign="top"

|[[Файл:ICDAR2019Sample.png |600px|thumb|~~Рисунок 23. Сэмпл из датасета~~ ICDAR 2019 "Scene Text Visual Question Answering"]]

|}

Dbolotov

61

правка

Изменения

Известные наборы данных

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты