RTMO: Towards High-Performance One-Stage Real-Time Multi-Person Pose Estimation

要約

リアルタイムの複数人の姿勢推定には、速度と精度のバランスをとる上で大きな課題があります。
2 段階のトップダウン方式は画像内の人物の数が増えると速度が低下しますが、既存の 1 段階方式では高精度とリアルタイム パフォーマンスを同時に実現できないことがよくあります。
このペーパーでは、YOLO アーキテクチャ内でデュアル 1-D ヒートマップを使用してキーポイントを表現することで座標分類をシームレスに統合する 1 段階の姿勢推定フレームワークである RTMO を紹介します。これにより、高速性を維持しながらトップダウン手法に匹敵する精度を実現します。
我々は、特に座標分類と密な予測モデルの間の非互換性に対処するために設計された、ヒートマップ学習用の動的座標分類器と調整された損失関数を提案します。
RTMO は最先端の 1 段階姿勢推定器を上回り、同じバックボーンで約 9 倍高速に動作しながら、COCO で 1.1% 高い AP を達成します。
当社の最大のモデルである RTMO-l は、COCO val2017 で 74.8% の AP と単一の V100 GPU で 141 FPS を達成し、その効率と精度を実証しました。
コードとモデルは https://github.com/open-mmlab/mmpose/tree/dev-1.x/projects/rtmo で入手できます。

要約(オリジナル)

Real-time multi-person pose estimation presents significant challenges in balancing speed and precision. While two-stage top-down methods slow down as the number of people in the image increases, existing one-stage methods often fail to simultaneously deliver high accuracy and real-time performance. This paper introduces RTMO, a one-stage pose estimation framework that seamlessly integrates coordinate classification by representing keypoints using dual 1-D heatmaps within the YOLO architecture, achieving accuracy comparable to top-down methods while maintaining high speed. We propose a dynamic coordinate classifier and a tailored loss function for heatmap learning, specifically designed to address the incompatibilities between coordinate classification and dense prediction models. RTMO outperforms state-of-the-art one-stage pose estimators, achieving 1.1% higher AP on COCO while operating about 9 times faster with the same backbone. Our largest model, RTMO-l, attains 74.8% AP on COCO val2017 and 141 FPS on a single V100 GPU, demonstrating its efficiency and accuracy. The code and models are available at https://github.com/open-mmlab/mmpose/tree/dev-1.x/projects/rtmo.

arxiv情報

著者 Peng Lu,Tao Jiang,Yining Li,Xiangtai Li,Kai Chen,Wenming Yang
発行日 2023-12-12 18:55:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク