Изменения

Перейти к: навигация, поиск

Определение положения человека

1915 байт добавлено, 23 январь
OpenPose (2018)
|[[file:Openposeschema.png|500px|thumb|Рисунок 10 [[https://arxiv.org/pdf/1611.08050.pdf x]]]]
|}
Архитектура решения кратко изображена на рисунке 10Логика архитектуры OpenPose следующая: решение является многослойной во-первых, входное RGB-изображение (рис. 1а) подается как вход в многослойную CNN с двумя ветвями. Каждый слой в первой Две ветви означают, что CNN производит два разных вывода. На рисунке 10 верхняя ветвь, показанная бежевым цветом, предсказывает карту уверенности S^tкарты достоверности (англ. confidence map) (рис. 1b) расположения различных частей тела. Нижняя ветвь, показанная синим цветом, и каждый слой второй ветви предсказывает сходство поля сходства фрагментов (англ. ''affinity field, PAFs'') (рис. 1c), которые представляют степень связи между различными частями тела.Многоступенчатость: на первом этапе (левая половина рисунка 10) сеть создает начальный набор карт достоверности обнаружения S и набор полей сходства для части L^t. После каждого слоя, результаты Затем на каждой ветвипоследующей стадии (правая половина рисунка 10) прогнозы из обеих ветвей на предыдущем этапе, вместе с признаками характеристиками исходного изображенияF, объединяются (обозначены знаком + на рисунке 10) и используются для следующего слояполучения более точных прогнозов. В реализации OpenPose последним этапом t выбран шестой.На рис. 3 показаны положительные преимущества многослойной архитектуры. В этом примере мы наблюдаем некоторую начальную путаницу между левой и правой частями тела на первых нескольких этапах. Но по мере того, как слой увеличивается, сеть различает их лучше.В конце карты достоверности и поля сходства обрабатываются методом жадного вывода (рис. 1d) для вывода двумерных ключевых точек для всех людей на изображении (рис. 1e)
<br><br><br><br><br><br><br><br><br>
Анонимный участник

Навигация