Изменения

Задача нахождения объектов на изображении

739 байт добавлено, 02:37, 10 апреля 2020

→‎Fast R-CNN

[[Файл:Fast-R-CNN.png|300px|thumb|right|Схема работы Fast R-CNN]]

За счёт того, что в R-CNN для каждого из 2000 регионов классификация производится отдельно, обучение сети занимает большой объём времени. Оригинальной версии алгоритма R-CNN для обработки каждого тестового изображения требовалось порядка 47 секунд, поэтому его авторы предложили алгоритм, улучшающий производительность {{- --}} Fast R-CNN. Его характерной особенностью является подача на вход CNN не отдельных регионов, а всего изображения сразу для ~~формирования~~ получения общей карты ~~объектов~~признаков. ~~Преобразование~~ Предложенные регионы накладываются на общую карту признаков , и в результате количество операций свёртки существенно уменьшается. Поскольку регионы имеют разный размер, необходимо привести признаки к фиксированному размеру ~~производится с помощью~~ при помощи операции RoIPooling (Region of ~~Interest (RoI~~interest pooling). ~~Принцип RoI заключается в делении региона~~ В рамках RoIPooling регион делится на сетку, ~~размер~~ размерность ячеек которой совпадает с размерностью выхода, после чего по ячейкам сетки проводится выбор максимального значения. ~~Таким образом~~Полученные регионы фиксированного размера далее являются входом для полносвязного слоя, ~~операция свёртки применяется только один раз~~ который и осуществляет как классификацию, так и линейную регрессию для ~~каждого изображения~~сдвига границ bounding box-ов. ~~Также~~ Стоит отметить, что в Fast R-CNN используется совместное обучение SVMдля классификации, CNN и bounding-box регрессора вместо независимого их обучения{{---}}для этого используется совместная функция потерь.

===Faster R-CNN===

Анонимный участник

77.234.203.52

Изменения

Задача нахождения объектов на изображении

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

Инструменты