Изменения

Перейти к: навигация, поиск

Оценка положения

462 байта добавлено, 00:59, 15 декабря 2020
Нет описания правки
=== Задача Perspective-n-Point (PnP) ===
[[Файл:Pnp.gif |400px|thumb| right| Рис. 1 Задача При оптическом отслеживании для определения положения объекта в пространстве решается так называемая задача PnP (PnPPerspective-n-Point)]], когда по перспективной проекции объекта на плоскость сенсора камеры необходимо определить положение объекта в 3D-пространстве.
При оптическом отслеживании для определения положения Для заданной 3D-модели объекта в пространстве решается так называемая задача PnP (Perspectiveи 2D-n-Point), когда по перспективной проекции объекта на плоскость сенсора камеры необходимо определить положение объекта решается система уравнений. В результате чего получается множество возможных решений. Количество решений зависит от числа точек в 3D-пространствемодели объекта. Однозначное решение для определения 6-DoF положения объекта можно получить как минимум при 4 точках. Для треугольника получается от 2 до 4 возможных решений, то есть положение не может быть определено однозначно.  <div style="text-align: center"><ul> <li style="display: inline-block;"> [[Файл:Pnp.gif |400px|thumb|center| Рис. 1 Задача (PnP)]] </li><li style="display: inline-block;"> [[Файл:triangles.gif |400px|thumb|center| Рис.2 Решение "треугольников"]] </li></ul></div>
Для заданной 3D-модели объекта и 2D-проекции объекта на плоскость камеры решается система уравнений. В результате чего получается множество возможных решений. Количество решений зависит от числа точек в 3D-модели объекта. Однозначное решение для определения 6-DoF положения объекта можно получить как минимум при 4 точках. Для треугольника получается от 2 до 4 возможных решений, то есть положение не может быть определено однозначно. [[Файл:triangles.gif |400px|thumb| right| Рис. 2 Решение "треугольников"]]
Решение предлагается достаточно большим количеством алгоритмов, реализованных в виде библиотек:
#'''[http://sv-journal.org/2015-4/09/index.php?lang=ru POS]''' ''(Pose from Orthography and Scaling)'', аппроксимирующий перспективную проекцию с помощью масштабированной ортогональной проекции и находящий матрицу поворота и вектор сдвига объекта путём решения линейной системы уравнений.
== Оценка положения человека ==
 
[[Файл:Deformable.png|600px|thumb|right|Рис. 5 Изобразительные структуры в классическом подходе решения задачи оценки положения человека.]]
 
[[Оценка положения человека|Оценка положения человека (англ. ''Human Pose Estimation'')]] {{---}} одна из важных задач последних нескольких десятилетий в области компьютерного зрения, которая является важным шагом к распознаванию людей на изображениях и видео. Задачу разбивают на 2 категории:
Оценку положения человека использует множество областей. В частности, распознавание действий, анимация, разработка игр, и другое.
Существуют различные подходы к решению данной задачи. Классический подход {{---}} использование изобразительных структур (англ. ''pictoral structures''). Основная идея заключается в том, чтобы представить объект в виде набора "частей", соединенных пружинами(Рис. 5). Каждая "часть" является шаблоном внешности, соответствующим изображению. Когда части параметризованы расположением пикселей и ориентацией, полученная структура может моделировать сочлененияв положении человека. Но Однако этот подход ограничен наличием моделей положенияэтих структур, которые не зависящих зависят напрямую от входного изображения. Улучшения данного подхода упираются в ограничение выразительности. Альтернативный подход {{---}} использование [[Сверточные нейронные сети|сверточных нейронных сетей (англ. ''convolutional neural networkConvolutional Neural Network, CNN'')]] и [[Глубокое обучение|глубокого обучения (англ. ''Deep learning'')]]. Большинство последних систем оценки положения человека используют именно этот подход, в значительной степени заменяя созданные вручную функции и графические модели. Использование машинного обучения значительно улучшило результаты. 
== Источники информации==
15
правок

Навигация