Изменения

Перейти к: навигация, поиск

Известные наборы данных

10 байт убрано, 19:36, 5 января 2021
Описание
Visual Genome {{---}} это исчерпывающий набор данных для обучения и тестирования моделей компьютерного зрения. Он обеспечивает многослойное понимание картинок. Это позволяет многосторонне изучать изображение: от информации на уровне пикселей, такой как объекты, до отношений, требующих дальнейшего вывода, и даже более глубокие задачи, такие как ответы на вопросы.
Изображение часто представляет сложную картину, которую невозможно полностью раскрыть одним предложением. Существующие наборы данных, такие как Flickr 30K, ориентированы на высокоточное описание изображения. Вместо этого для каждого изображения в Visual Genome, собираются более 50 описаний для разных регионов изображения, обеспечивая намного более плотный и полный набор описаний сценасценариев.
===Код===
Анонимный участник

Навигация