Изменения

Перейти к: навигация, поиск

Компьютерное зрение

3 байта добавлено, 19:27, 4 сентября 2022
м
rollbackEdits.php mass rollback
=Задачи компьютерного зрения=
Все задачи компьютерного зрения сводятся к анализу изображения или видеопотока(По сути представляющего из себя набор сменяющихся изображений), на котором требуется прежде всего выделить фрагмент, содержащий необходимую информацию. Для выделения обычно используют или прямоугольную область, которая ограничивает исходный фрагмент, или просто выделяют пиксели принадлежащие ему .
==Идентификация==
Задача идентификации состоит в том, чтобы классифицировать изображение целиком. Для этого на изображении выделяются ключевые области и по ним происходит классификация, например с помощью решающих деревьев, или [[Сверточные нейронные сети |сверточных нейронных сетей]].
==Распознавание объектов==
[[Файл:Object_detection.jpeg|600px|thumb|centre|Источник: [https://habr.com/ru/post/463991/]]]
Самым простым методом детекции объектов является метод скользящего окна методом R-CNN(англ. ''Regions with Convulational Neural Network'' - Выделение регионов с помощью свертоных сетей), при котором мы проходимся некоторым окном фиксированного размера по каждому кусочку картинки, и применяем к нему простой классификатор, обученный распознавать заранее определенный набор объектов. Модификации этого метода, такие как Faster R-CNN применяются до сих пор.
==Сегментация изображений==
==Анализ видео==
Так как видео представляет из себя набор изображений, одинакового размера, обычно сделанных через разные интервалы времени, то для него применимы все те задачи, которые были описаны ранее. Также появляются такие задачи как предсказание движения, заключающееся в том, чтобы по набору кадров предсказать положение объекта в следующих кадрах, или более общая задача ситуационный осведомленности(англ. Situation Awarness), заключающаяся в том, чтобы для каждого объекта в видео уметь определить его положение и статус на всех кадрах видео.
=Примечания=
1632
правки

Навигация