107
правок
Изменения
Источники
Модель Single Shot Detector (SSD) использует идею использования пирамидальной иерархии выходов свёрточной сети для эффективного обнаружения объектов различных размеров. Изображение последовательно передаётся на слои свёрточной сети, которые уменьшаются в размерах. Выход из последнего слоя каждой размерности участвует в принятии решения по детекции объектов, таким образом, складывается "пирамидальная характеристика" изображения. Это позволяет обнаруживать объекты различных масштабов, так как размерность выходов первых слоёв сильно коррелирует с ограничивающими рамками для крупных объектов, а последних {{---}} для небольших. В отличие от YOLO, SSD не разбивает изображение на сетку произвольного размера, а предсказывает смещение "anchor-ов" {{---}} ключевых рамок. Ключевые рамки на разных уровнях масштабируются так, что одна размерность выходного слоя отвечает за объекты своего масштаба. В результате, большие объекты могут быть обнаружены только на более высоком уровне, а маленькие объекты {{---}} на низких уровнях. Как и в других алгоритмах, функция потерь обеспечивает совместный вклад как потерь локализации, так и потерь классификации.
==См.также==
==Источники информации==
* [https://arxiv.org/abs/1502.02734 Weakly- and Semi-Supervised Learning of a DCNN for Semantic Image Segmentation]
* [https://arxiv.org/abs/1605.06211 Fully Convolutional Networks for Semantic Segmentation]
* [https://arxiv.org/abs/1505.04597 U-Net: Convolutional Networks for Biomedical Image Segmentation]
* [https://arxiv.org/abs/1611.09326 The One Hundred Layers Tiramisu: Fully Convolutional DenseNets for Semantic Segmentation]
* [https://arxiv.org/abs/1606.00915 DeepLab: Semantic Image Segmentation with Deep Convolutional Nets, Atrous Convolution, and Fully Connected CRFs]
* [https://arxiv.org/abs/1706.05587 Rethinking Atrous Convolution for Semantic Image Segmentation]
* [https://paperswithcode.com/paper/encoder-decoder-with-atrous-separable Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation]
* [https://arxiv.org/abs/1311.2524 Rich feature hierarchies for accurate object detection and semantic segmentation]
* [https://arxiv.org/abs/1504.08083 Fast R-CNN]
* [https://arxiv.org/abs/1506.01497 Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks]
* [https://arxiv.org/abs/1703.06870 Mask R-CNN]
* [https://arxiv.org/abs/1506.02640 You Only Look Once: Unified, Real-Time Object Detection]
* [https://arxiv.org/abs/1612.08242 YOLO9000: Better, Faster, Stronger]
* [https://arxiv.org/abs/1804.02767 YOLOv3: An Incremental Improvement]
* [https://arxiv.org/abs/1512.02325 SSD: Single Shot MultiBox Detector]
[[Категория: Машинное обучение]]