Редактирование: Известные наборы данных

Перейти к: навигация, поиск

Внимание! Вы не авторизовались на сайте. Ваш IP-адрес будет публично видимым, если вы будете вносить любые правки. Если вы войдёте или создадите учётную запись, правки вместо этого будут связаны с вашим именем пользователя, а также у вас появятся другие преимущества.

Правка может быть отменена. Пожалуйста, просмотрите сравнение версий, чтобы убедиться, что это именно те изменения, которые вас интересуют, и нажмите «Записать страницу», чтобы изменения вступили в силу.
Текущая версия Ваш текст
Строка 159: Строка 159:
 
   from sklearn.datasets import load_iris
 
   from sklearn.datasets import load_iris
 
   from sklearn.ensemble import RandomForestClassifier
 
   from sklearn.ensemble import RandomForestClassifier
  from sklearn import metrics
+
 
 
   iris=load_iris()
 
   iris=load_iris()
 
   X = iris.data
 
   X = iris.data
 
   Y = iris.target
 
   Y = iris.target
 +
  X, Y = shuffle(X, Y)
 
   n = len(iris.data)
 
   n = len(iris.data)
 
   train = n // 2
 
   train = n // 2
Строка 177: Строка 178:
 
           2      0.88      0.96      0.92        23
 
           2      0.88      0.96      0.92        23
 
   avg / total    0.95      0.95      0.95        75
 
   avg / total    0.95      0.95      0.95        75
 +
  
 
==MNIST==
 
==MNIST==
Строка 193: Строка 195:
  
  
   from sklearn.datasets import fetch_openml
+
   from sklearn.datasets import fetch_mldata
 
   from numpy import arange
 
   from numpy import arange
 
   import random
 
   import random
Строка 201: Строка 203:
 
[[Файл:Mnist-predict.png|мини|Рисунок 2. Результат работы классификатора]]
 
[[Файл:Mnist-predict.png|мини|Рисунок 2. Результат работы классификатора]]
  
   mnist = fetch_openml('MNIST_784')
+
   mnist = fetch_mldata('MNIST original')
 
   indices = arange(len(mnist.data))
 
   indices = arange(len(mnist.data))
 
   randidx = random.sample(list(indices), 500)
 
   randidx = random.sample(list(indices), 500)
Строка 213: Строка 215:
 
   expected = Y[train:]
 
   expected = Y[train:]
 
   predicted = clf.predict(X[train:])
 
   predicted = clf.predict(X[train:])
   print("Classification report for classifier %s:\n%s\n" % (clf, metrics.classification_report(expected, predicted)))
+
   print("Classification report for classifier %s:\n%s\n"
 +
    % (clf, metrics.classification_report(expected, predicted)))
  
 
     digit    precision    recall  f1-score  support
 
     digit    precision    recall  f1-score  support
Строка 521: Строка 524:
 
[[Файл:CelebA.jpg|мини|Рисунок 19. Пример изображений из CelebA [http://mmlab.ie.cuhk.edu.hk/projects/CelebA/overview.png Оригинал]]]
 
[[Файл:CelebA.jpg|мини|Рисунок 19. Пример изображений из CelebA [http://mmlab.ie.cuhk.edu.hk/projects/CelebA/overview.png Оригинал]]]
 
===Описание===
 
===Описание===
CelebA (англ. CelebFaces Attributes Dataset) {{---}} это крупномасштабный набор данных атрибутов лиц, содержащий более 200 тысяч изображений знаменитостей (см. рис. 19). Изображения в этом наборе данных охватывают лица людей с разных ракурсов. Более подробная характеристика датасета: 10 177 уникальных личностей, 202 599 изображений лиц и 5 ориентиров, 40 бинарных аннотаций атрибутов на изображение. Эти данные были первоначально собраны исследователями из MMLAB<ref>http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html[http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html]</ref>, Китайского университета Гонконга.
+
CelebA (англ. CelebFaces Attributes Dataset) {{---}} это крупномасштабный набор данных атрибутов лиц, содержащий более 200 тысяч изображений знаменитостей (см. рис. 19). Изображения в этом наборе данных охватывают лица людей с разных ракурсов. Изображения в CelebA имеют большое разнообразие, большое количество и богатые аннотации: 10 177 уникальных личностей, 202 599 изображений лиц и 5 ориентиров, 40 бинарных аннотаций атрибутов на изображение. Эти данные были первоначально собраны исследователями из MMLAB<ref>http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html[http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html]</ref>, Китайского университета Гонконга.
  
 
Набор данных можно использовать в качестве обучающих и тестовых наборов для следующих задач [[Компьютерное зрение|компьютерного зрения]]: распознавание атрибутов лица, обнаружение лиц и локализация ориентиров (или части лица).
 
Набор данных можно использовать в качестве обучающих и тестовых наборов для следующих задач [[Компьютерное зрение|компьютерного зрения]]: распознавание атрибутов лица, обнаружение лиц и локализация ориентиров (или части лица).
Строка 528: Строка 531:
 
Ниже приведен список бинарных атрибутов в CelebA, где отдельный атрибут {{---}} одна из характеристик лица.
 
Ниже приведен список бинарных атрибутов в CelebA, где отдельный атрибут {{---}} одна из характеристик лица.
 
Более подробно со всеми атрибутами можно ознакомиться [https://www.tensorflow.org/datasets/catalog/celeb_a здесь]
 
Более подробно со всеми атрибутами можно ознакомиться [https://www.tensorflow.org/datasets/catalog/celeb_a здесь]
 
+
[[Файл:CelebaAttributes.png|600px|thumb|centre|[https://towardsdatascience.com/celeba-attribute-prediction-and-clustering-with-keras-3d148063098d Источник]]]
{| class="wikitable"
 
|-
 
! Индекс атрибута
 
! Наименование
 
! Пояснение
 
|-
 
| 1
 
| 5oClockShadow
 
| щетина, появшившаяся в течение дня
 
|-
 
| 2
 
| ArchedEyebrows
 
| изогнутые брови
 
|-
 
| 3
 
| Attractive
 
| привлекательный/ая
 
|-
 
| 4
 
| BagsUnderEyes
 
| мешки под глазами
 
|-
 
| 5
 
| Bald
 
| лысый
 
|-
 
| 6
 
| Bangs
 
| челка
 
|-
 
| 7
 
| BigLips
 
| большие губы
 
|-
 
| 8
 
| BigNose
 
| большой нос
 
|-
 
| 9
 
| BlackHair
 
| темные волосы
 
|-
 
| 10
 
| BlondHair
 
| блондинистые волосы
 
|-
 
| 11
 
| Blurry
 
| размытый
 
|-
 
| 12
 
| BrownHair
 
| русые волосы
 
|-
 
| 13
 
| BushyEyebrows
 
| густые брови
 
|-
 
| 14
 
| Chubby
 
| полный
 
|-
 
| 15
 
| DoubleChin
 
| второй подбородок
 
|-
 
| 16
 
| Eyeglasses
 
| очки
 
|-
 
| 17
 
| Goatee
 
| козлиная бородка/эспаньолка
 
|-
 
| 18
 
| GrayHair
 
| седые волосы
 
|-
 
| 19
 
| HeavyMakeup
 
| много макияжа
 
|-
 
| 20
 
| HighCheekBones
 
| высокие скулы
 
|-
 
| 21
 
| Male
 
| мужчина
 
|-
 
| 22
 
| MouthSlighltyOpen
 
| слегка приоткрытый рот
 
|-
 
| 23
 
| Mustache
 
| усы
 
|-
 
| 24
 
| NarrowEyes
 
| узкий разрез глаз
 
|-
 
| 25
 
| NoBeard
 
| отсутствет борода
 
|-
 
| 26
 
| OvalFace
 
| овальное лицо
 
|-
 
| 27
 
| PaleSkin
 
| бледная кожа
 
|-
 
| 28
 
| PointyNose
 
| заостренный нос
 
|-
 
| 29
 
| RecedingHairline
 
| залысина
 
|-
 
| 30
 
| RosyCheeks
 
| розовые щеки
 
|-
 
| 31
 
| Sideburns
 
| бакенбарды
 
|-
 
| 32
 
| Smiling
 
| улыбка
 
|-
 
| 33
 
| StraightHair
 
| прямые волосы
 
|-
 
| 34
 
| WavyHair
 
| волнистые волосы
 
|-
 
| 35
 
| WearingEarrings
 
| присутствует серьга/серьги
 
|-
 
| 36
 
| WearingHat
 
| присутствует шляпа
 
|-
 
| 37
 
| WearingLipstick
 
| накрашены губы
 
|-
 
| 38
 
| WearingNecklace
 
| присутствует ожерелье
 
|-
 
| 39
 
| WearingNecktie
 
| присутствует галстук
 
|-
 
| 40
 
| Young
 
| молодой/ая
 
|}
 
  
 
==CityScapes==
 
==CityScapes==
Строка 706: Строка 543:
 
===Результаты===
 
===Результаты===
  
Основной метрикой для этого набора данных является [[Оценка качества в задаче кластеризации#Индекс Жаккара (англ. Jaccard Index)|индекс Жаккара]]. Также, хорошо известно, что глобальная мера Ыеиндекса Жаккара смещена в сторону экземпляров объектов, которые покрывают большую область изображения. В уличных сценах с их сильным изменением масштаба это может быть проблематично.
+
Основной метрикой для этого набора данных является [[Оценка качества в задаче кластеризации#Индекс Жаккара (англ. Jaccard Index)|индекс Жаккара]]. Также, хорошо известно, что глобальная мера [[Оценка качества в задаче кластеризации#Индекс Жаккара (англ. Jaccard Index)|индекса Жаккара]] смещена в сторону экземпляров объектов, которые покрывают большую область изображения. В уличных сценах с их сильным изменением масштаба это может быть проблематично.
 
Чтобы решить эту проблему, создатели датасета дополнительно оценивают семантическую маркировку, используя метрику пересечения по объединению на уровне экземпляра <math>
 
Чтобы решить эту проблему, создатели датасета дополнительно оценивают семантическую маркировку, используя метрику пересечения по объединению на уровне экземпляра <math>
 
iIoU = \dfrac{iTP}{iTP + FP + iFN}
 
iIoU = \dfrac{iTP}{iTP + FP + iFN}
Строка 714: Строка 551:
 
[[Файл:ICDAR2017.png|мини|Рисунок 21. Пример изображения из датасета ICDAR2017 Competition on Multi-lingual Scene Text Detection and Script Identification (MLT) [https://arxiv.org/pdf/1812.05219.pdf Источник]]]
 
[[Файл:ICDAR2017.png|мини|Рисунок 21. Пример изображения из датасета ICDAR2017 Competition on Multi-lingual Scene Text Detection and Script Identification (MLT) [https://arxiv.org/pdf/1812.05219.pdf Источник]]]
 
===Описание===
 
===Описание===
ICDAR<ref>https://rrc.cvc.uab.es/</ref> (англ. International Conference on Document Analysis and Recognition) {{---}} это международная конференция по анализу и распознаванию текста и одноименное семейство набора данных, состоящее из фотографий (см. рис. 21, 22 и 23), на которых изображен текст на разных языках. Данные наборы создаются для соревнований RRC (англ. Robust Reading Competition), где требуется решить следующие задачи: обнаружение текста, сегментация текста, распознавание символов, сквозное распознавание, распознавание скриптов, ответы на вопросы, связанные с изображениями.
+
ICDAR<ref>https://rrc.cvc.uab.es/</ref> (англ. International Conference on Document Analysis and Recognition) {{---}} это международная конференция по анализу и распознаванию текста и одноименное семейство набора данных, состоящее из фотографий (см. рис. 21, 22 и 23), на которых изображен текст на разных языках. Данные наборы создаются для соревнований RRC (англ.Robust Reading Competition), где требуется решить следующие задачи: обнаружение текста, сегментация текста, распознавание символов, сквозное распознавание, распознавание скриптов, ответы на вопросы, связанные с изображениями.
 
Ниже приведен анализ наборов данных ICDAR2013, ICDAR2015, ICDAR2017, ICDAR2019.
 
Ниже приведен анализ наборов данных ICDAR2013, ICDAR2015, ICDAR2017, ICDAR2019.
  
Строка 750: Строка 587:
 
|}
 
|}
  
<div class="oo-ui-panelLayout-scrollable" style="display: block; vertical-align:middle; height: auto; width: auto;">[[Файл:ICDARBDI.png|thumb|alt=ICDAR "Born Digital Images"|x200px|center|Рисунок 22. ICDAR "Born Digital Images". [https://arxiv.org/pdf/1812.05219.pdf Источник]]]</div>
+
{|align="center"
 
+
|-valign="top"  
<div class="oo-ui-panelLayout-scrollable" style="display: block; vertical-align:middle; height: auto; width: auto;">[[Файл:ICDARFST2.png|x150px|center|thumb|Рисунок 23. ICDAR "Focused Scene Text". [https://arxiv.org/pdf/1812.05219.pdf Источник]]]</div>
+
|[[Файл:ICDARBDI.png |600px|thumb|ICDAR "Born Digital Images". [https://arxiv.org/pdf/1812.05219.pdf Источник]]  
 
+
|}
  
 +
{|align="center"
 +
|-valign="top"
 +
|[[Файл:ICDARFST.png |600px|thumb|ICDAR "Focused Scene Text". [https://arxiv.org/pdf/1812.05219.pdf Источник]]
 +
|}
  
  
Строка 780: Строка 621:
 
| 5003
 
| 5003
 
| 3564
 
| 3564
| 1439
 
 
|-
 
|-
 
| ICDAR 2015 "Focused Scene Text"  
 
| ICDAR 2015 "Focused Scene Text"  
Строка 799: Строка 639:
 
|}
 
|}
  
<div class="oo-ui-panelLayout-scrollable" style="display: block; vertical-align:middle; height: auto; width: auto;">[[Файл:ICDARIST.png |x150px|center|thumb|Рисунок 24. ICDAR "Incidental Scene Text". [https://arxiv.org/pdf/1812.05219.pdf Источник]]]</div>
+
{|align="center"
 +
|-valign="top"  
 +
|[[Файл:ICDARIST.png |600px|thumb|ICDAR "Incidental Scene Text". [https://arxiv.org/pdf/1812.05219.pdf Источник]]  
 +
|}
  
 
===ICDAR 2017===
 
===ICDAR 2017===
 
'''ICDAR 2017 "COCO-Text"''' {{---}} набор данных, основанный на датасете "MS COCO"<ref>https://vision.cornell.edu/se3/wp-content/uploads/2019/01/ICDAR2017b.pdf</ref>, где собраны обычные изображения ежедневных сцен, на которых, возможно, есть текст. Текст на изображениях на английском, немецком, французском и других языках. Датасет предназначен для следующих задач оптического распознавани символов: обнаружение текста, распознавание символов , сквозное распознавание.
 
 
'''ICDAR 2017 "Multi-lingual Scene Text"''' {{---}} набор данных, где собраны изображения с текстом на 9 языках. Текст на изображениях на арабском, английском, немецком, бенгальском, китайском, японском, французском, корейском языках. Датасет предназначен для следующих задач оптического распознавани символов: обнаружение текста, сегментация текста.
 
 
'''ICDAR 2017 "French Street Name Signs"''' {{---}} набор данных с изображениями, на которых есть названия французских улиц. Текст на изображениях на французском языке. Датасет предназначен для следующих задач оптического распознавани символов: сквозное распознавание.
 
  
 
{| class="wikitable"
 
{| class="wikitable"
 
|-
 
|-
 
! Наименование датасета
 
! Наименование датасета
 +
! Тип текста
 
! Количество объектов
 
! Количество объектов
 
! Количество обучающих объектов
 
! Количество обучающих объектов
Строка 818: Строка 656:
 
! Количество обучающих слов
 
! Количество обучающих слов
 
! Количество тестовых слов
 
! Количество тестовых слов
 +
! Язык текста на изображениях
 +
! Задачи
 
|-
 
|-
 
| ICDAR 2017 "COCO-Text"
 
| ICDAR 2017 "COCO-Text"
 +
| набор данных, основанный на датасете "MS COCO"<ref>https://vision.cornell.edu/se3/wp-content/uploads/2019/01/ICDAR2017b.pdf</ref>, где собраны обычные изображения ежедневных сцен, на которых, возможно, есть текст
 
| 63686
 
| 63686
 
| 43686  
 
| 43686  
Строка 826: Строка 667:
 
| -
 
| -
 
| -
 
| -
 +
| Французский
 +
| сквозное распознавание
 
|-
 
|-
 
| ICDAR 2017 "Multi-lingual Scene Text"  
 
| ICDAR 2017 "Multi-lingual Scene Text"  
 +
| изображения с текстом на 9 различных языках
 
| 18 000
 
| 18 000
 
| -  
 
| -  
Строка 834: Строка 678:
 
| -  
 
| -  
 
| -
 
| -
 +
| Английский, Арабский, Бенгальский, Китайский, Французский, Немецкий, Японский, Корейский
 +
| обнаружение текста, сегментация текста
 
|-
 
|-
 
| ICDAR 2017 "French Street Name Signs"  
 
| ICDAR 2017 "French Street Name Signs"  
 +
| изображения, на которых есть названия француззских улиц
 
| 1 081 422, где каждое изображение содержит до 4 объектов с названией улицы
 
| 1 081 422, где каждое изображение содержит до 4 объектов с названией улицы
 
| -
 
| -
Строка 842: Строка 689:
 
| -  
 
| -  
 
| -  
 
| -  
 +
| Английский
 +
| обнаружение текста, сегментация текста, распознавание символов, сквозное распознавание
 
|}
 
|}
 
<div class="oo-ui-panelLayout-scrollable" style="display: block; vertical-align:middle; height: auto; width: auto;">[[Файл:ICDARCOCO.png |x250px|center|thumb|Рисунок 25. ICDAR "COCO-Text". [https://arxiv.org/pdf/1812.05219.pdf Источник]]]</div>
 
 
<div class="oo-ui-panelLayout-scrollable" style="display: block; vertical-align:middle; height: auto; width: auto;">[[Файл:ICDARMSTD.png |x250px|center|thumb|Рисунок 26. ICDAR "Multi-lingual Scene Text". [https://arxiv.org/pdf/1812.05219.pdf Источник]]]</div>
 
 
<div class="oo-ui-panelLayout-scrollable" style="display: block; vertical-align:middle; height: auto; width: auto;">[[Файл:ICDARFS2.png |x150px|center|thumb|Рисунок 27. ICDAR "French Street Name Signs". [https://arxiv.org/pdf/1812.05219.pdf Источник]]]</div>
 
  
 
===ICDAR 2019===
 
===ICDAR 2019===
 
'''ICDAR 2019 "COCO-Text"''' {{---}} набор данных, основанный на датасете "MS COCO"<ref>https://vision.cornell.edu/se3/wp-content/uploads/2019/01/ICDAR2017b.pdf</ref>, где собраны обычные изображения ежедневных сцен, на которых, возможно, есть текст. Текст на изображениях на английском, немецком, французском и других языках. Датасет предназначен для следующих задач оптического распознавани символов: сквозное распознавание.
 
 
'''ICDAR 2019 "Multi-lingual Scene Text"''' {{---}} набор данных, где собраны изображения с текстом на 10 языках. Текст на изображениях на арабском, английском, деванагари, немецком, бенгальском, китайском, японском, французском, корейском языках. Датасет предназначен для следующих задач оптического распознавани символов: обнаружение текста, идентификация скрипта, сквозное распознавание.
 
 
'''ICDAR 2019 "Scene Text Visual Question Answering"''' {{---}} набор данных, включающий 23 038 изображений с 31 791 парой вопросов и ответов, где ответ всегда основан на присутствующих текстовых экземплярах на изображении. Текст на изображениях на янглийском языке. Датасет предназначен для следующих задач оптического распознавани символов: ответ на вопрос, связанный с изображением.
 
 
  
 
{| class="wikitable"
 
{| class="wikitable"
 
|-
 
|-
 
! Наименование датасета
 
! Наименование датасета
 +
! Тип текста
 
! Количество объектов
 
! Количество объектов
 
! Количество обучающих объектов
 
! Количество обучающих объектов
Строка 868: Строка 705:
 
! Количество обучающих слов
 
! Количество обучающих слов
 
! Количество тестовых слов
 
! Количество тестовых слов
 +
! Язык текста на изображениях
 +
! Задачи
 
|-
 
|-
 
| ICDAR 2019 "COCO-Text"
 
| ICDAR 2019 "COCO-Text"
 +
| набор данных, основанный на датасете "MS COCO"<ref>https://vision.cornell.edu/se3/wp-content/uploads/2019/01/ICDAR2017b.pdf</ref>, где собраны обычные изображения ежедневных сцен, на которых, возможно, есть текст
 
| 63686
 
| 63686
 
| 43686  
 
| 43686  
Строка 876: Строка 716:
 
| -
 
| -
 
| -
 
| -
 +
| Французский
 +
| сквозное распознавание
 
|-
 
|-
 
| ICDAR 2019 "Multi-lingual Scene Text"<ref>https://arxiv.org/pdf/1907.00945.pdf</ref>
 
| ICDAR 2019 "Multi-lingual Scene Text"<ref>https://arxiv.org/pdf/1907.00945.pdf</ref>
 +
| изображения с текстом на 10 различных языках
 
| 20 000 (2 000 для каждого языка) + 277 000 сгенерированных изображения
 
| 20 000 (2 000 для каждого языка) + 277 000 сгенерированных изображения
 
| 10 000
 
| 10 000
Строка 884: Строка 727:
 
| -  
 
| -  
 
| -
 
| -
 +
| Английский, Арабский, Бенгальский, Деванагари, Китайский, Французский, Немецкий, Японский, Корейский
 +
| обнаружение текста, идентификация скрипта, сквозное распознавание
 
|-
 
|-
 
| ICDAR 2019 "Scene Text Visual Question Answering"  
 
| ICDAR 2019 "Scene Text Visual Question Answering"  
| 23 038
+
| набор данных, включающий
 +
23 038 изображений с 31 791 парой вопросов и ответов,
 +
где ответ всегда основан на присутствующих текстовых экземплярах
 +
на изображении.
 
| -
 
| -
 
| -
 
| -
Строка 893: Строка 741:
 
| -  
 
| -  
 
| -  
 
| -  
 +
| Английский
 +
| ответ на вопрос, связанный с изображением
 
|}
 
|}
  
<div class="oo-ui-panelLayout-scrollable" style="display: block; vertical-align:middle; height: auto; width: auto;">[[Файл:ICDAR2019Sample.png |x1400px|center|thumb|Рисунок 28. ICDAR 2019 "Scene Text Visual Question Answering". [https://arxiv.org/pdf/1907.00490.pdf Источник]]]</div>
+
{|align="center"
 +
|-valign="top"  
 +
|[[Файл:ICDARSamples.png |600px|thumb|Рисунок 22. Сэмплы из датасетов ICDAR 2011, ICDAR 2015, ICDAR 2017]]
 +
|}
 +
 
 +
{|align="center"
 +
|-valign="top"  
 +
|[[Файл:ICDAR2019Sample.png |600px|thumb|Рисунок 23. Сэмпл из датасета ICDAR 2019 "Scene Text Visual Question Answering"]]  
 +
|}
  
 
==Pointing'04==
 
==Pointing'04==
Строка 907: Строка 765:
 
{|align="center"
 
{|align="center"
 
  |-valign="top"  
 
  |-valign="top"  
  |[[Файл:Pointing.png|600px|thumb|Рисунок 29. Пример сета изображений Pointing'04 [https://www.researchgate.net/publication/221545772_Evaluation_of_Head_Pose_Estimation_for_Studio_Data Источник]]]
+
  |[[Файл:Pointing.png|600px|thumb|Рисунок 24. Пример сета изображений Pointing'04 [https://www.researchgate.net/publication/221545772_Evaluation_of_Head_Pose_Estimation_for_Studio_Data Источник]]]
 
  |}
 
  |}
  
Строка 926: Строка 784:
 
{|align="right"
 
{|align="right"
 
  |-valign="top"  
 
  |-valign="top"  
  |[[Файл:FASSEG3.png|300px|thumb|Рисунок 30. Сегментация изображения [https://github.com/massimomauro/FASSEG-repository/blob/master/papers/multiclass_face_segmentation_ICIP2015.pdf Источник]]]
+
  |[[Файл:FASSEG3.png|300px|thumb|Рисунок 25. Сегментация изображения [https://github.com/massimomauro/FASSEG-repository/blob/master/papers/multiclass_face_segmentation_ICIP2015.pdf Источник]]]
 
  |}
 
  |}
  
Изображение размечается на 6 сегментов (см. рис. 30):
+
Изображение размечается на 6 сегментов (см. рис. 25):
 
*глаза;
 
*глаза;
 
*нос;
 
*нос;
Строка 942: Строка 800:
 
{|align="center"
 
{|align="center"
 
  |-valign="top"  
 
  |-valign="top"  
  |[[Файл:FASSEG1.png|300px|thumb|Рисунок 31. Пример изображений из датасетов Frontal01 и Frontal02 [https://raw.githubusercontent.com/massimomauro/FASSEG-dataset/master/other/V1V2_diff.png Оригинал]]]
+
  |[[Файл:FASSEG1.png|300px|thumb|Рисунок 26. Пример изображений из датасетов Frontal01 и Frontal02 [https://raw.githubusercontent.com/massimomauro/FASSEG-dataset/master/other/V1V2_diff.png Оригинал]]]
  |[[Файл:FASSEG2.png|400px|thumb|Рисунок 32. Пример изображений из датасета Multipose01 [https://github.com/massimomauro/FASSEG-repository/blob/master/papers/pose_estimation_by_segmentation_ICME2017.pdf Источник]]]
+
  |[[Файл:FASSEG2.png|400px|thumb|Рисунок 27. Пример изображений из датасета Multipose01 [https://github.com/massimomauro/FASSEG-repository/blob/master/papers/pose_estimation_by_segmentation_ICME2017.pdf Источник]]]
 
  |}
 
  |}
 +
  
 
==MPI==
 
==MPI==
Строка 956: Строка 815:
 
{|align="right"
 
{|align="right"
 
  |-valign="top"  
 
  |-valign="top"  
  |[[Файл: MPI1.jpg|500px|thumb|Рисунок 33. Пример изображений из подкласса датасета MPI [http://human-pose.mpi-inf.mpg.de/#dataset Источник]]]
+
  |[[Файл: MPI1.jpg|500px|thumb|Рисунок 28. Пример изображений из подкласса датасета MPI [http://human-pose.mpi-inf.mpg.de/#dataset Источник]]]
 
  |}
 
  |}
  
 
Датасет представлен двадцатью различными классами активности: езда на велосипеде, упражнения, танцы, рыбалка и охота, домашняя активность, ремонт, отдых, активность на природе, игра на музыкальных инструментах, религиозная деятельность, бег, самоуход, спорт, передвижение на транспорте, волонтерство, прогулки, активность на воде, зимние виды активности, разное.
 
Датасет представлен двадцатью различными классами активности: езда на велосипеде, упражнения, танцы, рыбалка и охота, домашняя активность, ремонт, отдых, активность на природе, игра на музыкальных инструментах, религиозная деятельность, бег, самоуход, спорт, передвижение на транспорте, волонтерство, прогулки, активность на воде, зимние виды активности, разное.
  
Каждый класс также разделен на уникальные подклассы. Пример такого разделения приведен на рисунке 33.
+
Каждый класс также разделен на уникальные подклассы. Пример такого разделения приведен на рисунке 28.
  
 
Датасет снабжен документацией с описанием структуры объектов и методами взаимодействия с ними, всю необходимую информацию по датасету, как и сами исходники, можно получить по [http://human-pose.mpi-inf.mpg.de/ ссылке].
 
Датасет снабжен документацией с описанием структуры объектов и методами взаимодействия с ними, всю необходимую информацию по датасету, как и сами исходники, можно получить по [http://human-pose.mpi-inf.mpg.de/ ссылке].

Пожалуйста, учтите, что любой ваш вклад в проект «Викиконспекты» может быть отредактирован или удалён другими участниками. Если вы не хотите, чтобы кто-либо изменял ваши тексты, не помещайте их сюда.
Вы также подтверждаете, что являетесь автором вносимых дополнений, или скопировали их из источника, допускающего свободное распространение и изменение своего содержимого (см. Викиконспекты:Авторские права). НЕ РАЗМЕЩАЙТЕ БЕЗ РАЗРЕШЕНИЯ ОХРАНЯЕМЫЕ АВТОРСКИМ ПРАВОМ МАТЕРИАЛЫ!

Чтобы изменить эту страницу, пожалуйста, ответьте на приведённый ниже вопрос (подробнее):

Отменить | Справка по редактированию (в новом окне)

Шаблон, используемый на этой странице: