Изменения

Перейти к: навигация, поиск

Задача нахождения объектов на изображении

739 байт добавлено, 02:37, 10 апреля 2020
Fast R-CNN
[[Файл:Fast-R-CNN.png|300px|thumb|right|Схема работы Fast R-CNN]]
За счёт того, что в R-CNN для каждого из 2000 регионов классификация производится отдельно, обучение сети занимает большой объём времени. Оригинальной версии алгоритма R-CNN для обработки каждого тестового изображения требовалось порядка 47 секунд, поэтому его авторы предложили алгоритм, улучшающий производительность {{- --}} Fast R-CNN. Его характерной особенностью является подача на вход CNN не отдельных регионов, а всего изображения сразу для формирования получения общей карты объектовпризнаков. Преобразование Предложенные регионы накладываются на общую карту признаков , и в результате количество операций свёртки существенно уменьшается. Поскольку регионы имеют разный размер, необходимо привести признаки к фиксированному размеру производится с помощью при помощи операции RoIPooling (Region of Interest (RoIinterest pooling). Принцип RoI заключается в делении региона В рамках RoIPooling регион делится на сетку, размер размерность ячеек которой совпадает с размерностью выхода, после чего по ячейкам сетки проводится выбор максимального значения. Таким образомПолученные регионы фиксированного размера далее являются входом для полносвязного слоя, операция свёртки применяется только один раз который и осуществляет как классификацию, так и линейную регрессию для каждого изображениясдвига границ bounding box-ов. Также Стоит отметить, что в Fast R-CNN используется совместное обучение SVMдля классификации, CNN и bounding-box регрессора вместо независимого их обучения{{---}}для этого используется совместная функция потерь.
===Faster R-CNN===
Анонимный участник

Навигация