Изменения

Известные наборы данных

2198 байт добавлено, 23:47, 12 января 2021

→‎ICDAR

| Английский

| обнаружение текста, сегментация текста, распознавание символов, '''сквозное распознавание'''

|}

===ICDAR 2019===

{| class="wikitable"

|-

! Наименование датасета

! Тип текста

! Количество объектов

! Количество обучающих объектов

! Количество тестовых объектов

! Количество слов

! Количество обучающих слов

! Количество тестовых слов

! Язык текста на изображениях

! Задачи

|-

| ICDAR 2019 "COCO-Text"

| набор данных, основанный на датасете "MS COCO"<ref>https://vision.cornell.edu/se3/wp-content/uploads/2019/01/ICDAR2017b.pdf</ref>, где собраны обычные изображения ежедневных сцен, на которых, возможно, есть текст

| 63686

| 43686

| 10000 {---} валидирующая выборка, 10000 {---} тестовая

| 173589

| не описано

| Французский

| '''сквозное распознавание'''

|-

| ICDAR 2019 "Multi-lingual Scene Text"<ref>https://arxiv.org/pdf/1907.00945.pdf</ref>

| изображения с текстом на 10 различных языках

| 20 000 (2 000 для каждого языка) + 277 000 сгенерированных изображения

| 10 000

| не описано

| Английский, Арабский, Бенгальский, Деванагари, Китайский, Французский, Немецкий, Японский, Корейский

| обнаружение текста, идентификация скрипта, сквозное распознавание

|-

| ICDAR 2019 "Scene Text Visual Question Answering"

| набор данных, включающий

23 038 изображений с 31 791 парой вопросов и ответов.

где ответ всегда основан на присутствующих текстовых экземплярах

на изображении.

| -

| Английский

| ответ на вопрос, связанный с изображением

|}

Dbolotov

61

правка

Изменения

Известные наборы данных

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты