125
правок
Изменения
→OpenPose (2019)
Две ветви означают, что CNN производит два разных вывода. На рисунке 14 верхняя ветвь, показанная бежевым цветом, предсказывает карты достоверности (англ. ''confidence map'') (рисунок 13b) расположения различных частей тела. Нижняя ветвь, показанная синим цветом, предсказывает поля сходства фрагментов (англ. ''affinity field'', '''''PAFs''''') (рисунок 13c), которые представляют степень связи между различными частями тела.
Многослойность означает следующее: на первом этапе (левая половина рисунка 14) сеть создает начальный набор карт достоверности обнаружения $S$ и набор полей сходства для части $L$. Затем на каждой последующей стадии (правая половина рисунка 14) прогнозы из обеих ветвей на предыдущем этапе, вместе с характеристиками и характеристики исходного изображения $F$, объединяются (обозначены объединение обозначено знаком $+ $ на рисунке 14) и используются для получения более точных прогнозов. В реализации OpenPose последним этапом $t$ выбран шестой.
На рисунке 15 показаны преимущества многослойной архитектуры. В этом примере мы наблюдаем некоторую начальную путаницу между левой и правой частями тела на первых нескольких этапах. Но по мере того, как слой увеличивается, сеть начинает лучше различать их.