Нет однозначного ответа на вопрос, какие алгоритмы компьютерного зрения лучше всего подходят для оценки человеческих поз. Несколько моделей, которые используются для решения этой задачи:
- OpenPose. habr.com Методика «снизу вверх»: сеть сначала определяет части тела или ключевые точки изображения, а затем сопоставляет их для образования пар. habr.com В основе архитектуры — свёрточная нейронная сеть. habr.com
- DeepCut. habr.com Модель одновременно решает задачи распознавания и определения положения тела. habr.com Суть в распознавании всех возможных частей тела на изображении с последующей их разметкой (голова, руки, ноги и так далее) и дальнейшем разделении частей тела, принадлежащих каждому из людей. habr.com
- Mask R-CNN. intsysmagazine.ru habr.com Популярный алгоритм сегментации, архитектуру которого можно легко расширить для решения задач оценки позы человека. intsysmagazine.ru Модель позволяет одновременно локализовать и классифицировать объекты при помощи создания ограничивающего прямоугольника вокруг объекта и маски сегментации. habr.com
- PoseNet. intsysmagazine.ru Может использоваться для оценки позы одного или нескольких людей и запускаться на лёгких устройствах, таких как браузеры или мобильные устройства. intsysmagazine.ru
- DCPose. intsysmagazine.ru Определяет позу человека из нескольких кадров. intsysmagazine.ru Модель пытается преодолеть такие проблемы, как размытость изображения при движении, расфокусированное видео и перекрытия, возникающие из-за зависимости от каждого видеокадра. intsysmagazine.ru
- High-Resolution Net (HRNet). intsysmagazine.ru Находит ключевые точки относительно конкретного объекта или человека на изображении. intsysmagazine.ru
Выбор конкретной модели и метода зависит от требований конкретной задачи и доступных вычислительных ресурсов. cyberleninka.ru