10
правок
Изменения
Правки к конспекту по МЛ
===Описание===
[[Файл:ADE20KADE20K_merged.png|мини|Пример изображения Изображение из ADE20Kи его разбиение на части. [https://groups.csail.mit.edu/vision/datasets/ADE20K/assets/images/frame_rjob6ak7h3ivflyt_seg.png Оригинал]]]ADE20K {{---}} набор изображений с размеченными сущностями, который хорошо подходит для задачи [[Сегментация изображений|семантической сегментации данных ]] в компьютерном зрении. Особенность этого набора состоит в том, что кроме объектов приводится также информация об их составных частях: например, если на изображении находится человек, то в дополнение к местоположению его фигуры будет также приведено положение его глаз и носа.
Подобные наборы данных часто страдают от несогласованности меток при их разметке сообществом. Для ADE20K эта проблема была решена {{---}} все изображения размечал только один человек, что обусловило высокую согласованность меток.
===Структура данных <ref>https://groups.csail.mit.edu/vision/datasets/ADE20K/#Description</ref>===
Всего в наборе данных находится 22 210 изображений, из них 20 210 составляют набор для обучения, а 2 000 {{---}} набор для проверки. Максимальный размер изображения {{---}} 4500x6000p. Минимальный {{---}} 130x96p. Средний размер изображений равен 1.5Мп. К каждому изображению прилагается его RGB-оригинал (*.jpg), сегментация на сущности (*_seg.png), несколько изображений с сегментацией на части (*_seg_N.png, где N {{---}} это число) и описание признаков на изображении (*.txt).
ADE20K также содержит дополнительный файл на языке MATLAB, который позволяет загрузить изображения и информацию об их признаках.
===Результаты===
Основными метриками для этого набора данных являются пиксельная точность (англ. Pixel accuracy), которая состоит из доли корректно классифицированных пикселей, и мера [[Оценка качества в задаче кластеризации#Индекс Жаккара<ref>https://en.wikipedia.org/wiki/Jaccard_index</ref> (англ . Jaccard index, Intersection-over-Union, IoUIndex)|индекс Жаккара]]. На момент создания ADE20K, лучшие алгоритмы машинного обучения давали пиксельную точность равную ~76% и меру индекс Жаккара равную равный ~0.34 на проверочном множестве<ref>https://arxiv.org/pdf/1608.05442.pdf</ref>. Сейчас лучшей нейронной сетью для этого набора данных является [https://arxiv.org/pdf/16082004.0544208955v1.pdf ResNeSt], который позволяет достичь 82.07% пиксельной точности и меру индекс Жаккара 46.91%.
==COCO==