Изменения

Перейти к: навигация, поиск

Известные наборы данных

14 байт убрано, 03:16, 12 января 2021
Описание
Visual Genome {{---}} это набор данных, связывающий изображения с словестным описанием их содержимого. Является исчерпывающим набором данных для обучения и тестирования моделей компьютерного зрения, обеспечивает обширный анализ содержимого в изображениях с учетом зависимостей между объектами. Это позволяет многосторонне изучать изображение: от информации на уровне пикселей, такой как объекты, до отношений, требующих дальнейшего вывода, и даже более глубокие задачи, такие как ответы на вопросы.
Набор данных содержит более 108К изображений, каждое из которых имеет в среднем 35 объектовИзображение часто представляет сложную картину, 26 атрибутов и 21 парное отношение между объектамикоторую невозможно полностью раскрыть одним предложением. В данном наборе Существующие наборы данных происходит канонизация объектов, атрибутовтакие как Flickr 30K, отношений и словосочетаний ориентированы на высокоточное описание всего изображения в описаниях регионов и пар вопрос-ответ целом. Вместо этого для каждого изображения в синсеты из [https://ru.wikipedia.org/wiki/WordNet WordNet]. Cинсет {{---}} это набор даныхVisual Genome, элементы в котором считаются семантически эквивалентными собираются более 50 описаний для поиска или восстановления информации. Вместе эти аннотации представляют самый плотный и самый большой разных регионов изображения, обеспечивая тем самым намного более полный набор данных с описаниями изображений, объекты, атрибуты, отношения и пары вопрос-ответописаний сценариев.
Изображение часто представляет сложную картинуНабор данных содержит более 108К изображений, каждое из которых имеет в среднем 35 объектов, которую невозможно полностью раскрыть одним предложением26 атрибутов и 21 парное отношение между объектами. Существующие наборы В данном наборе данныхпроисходит канонизация объектов, такие как Flickr 30Kатрибутов, ориентированы на высокоточное описание изображенияотношений и словосочетаний в описаниях регионов и пар вопрос-ответ в синсеты из [https://ru. Вместо этого wikipedia.org/wiki/WordNet WordNet]. Cинсет {{---}} это набор даных, элементы в котором считаются семантически эквивалентными для каждого изображения в поиска или восстановления информации. Visual Genomeявляется самым большим набором данных с описаниями изображений, объектов, собираются более 50 описаний для разных регионов изображенияатрибутов, обеспечивая намного более полный набор описаний сценариевотношений и пар вопрос-ответ.
===Код===
Анонимный участник

Навигация