3D Human Pose Regression using Graph Convolutional Network

要約

人間の 3D 姿勢の推定は、体の一部が隠れていたり姿勢が曖昧であったりするため、困難な作業です。
グラフ畳み込みネットワークは、人間の骨格の構造情報を隣接行列の形式でエンコードします。これは、より良い姿勢予測に役立ちます。
2D ポーズからの 3D 人間のポーズ回帰のために、PoseGraphNet という名前のそのようなグラフ畳み込みネットワークの 1 つを提案します。
私たちのネットワークは、隣接グループに固有の適応隣接マトリックスとカーネルを使用します。
3D姿勢推定の標準データセットであるHuman3.6Mデータセットでモデルを評価します。
私たちのモデルのパフォーマンスは最先端に近いですが、パラメーターははるかに少なくなっています。
このモデルは、物理的な接続はないが動作が類似しているジョイント間の興味深い隣接関係を学習します。

要約(オリジナル)

3D human pose estimation is a difficult task, due to challenges such as occluded body parts and ambiguous poses. Graph convolutional networks encode the structural information of the human skeleton in the form of an adjacency matrix, which is beneficial for better pose prediction. We propose one such graph convolutional network named PoseGraphNet for 3D human pose regression from 2D poses. Our network uses an adaptive adjacency matrix and kernels specific to neighbor groups. We evaluate our model on the Human3.6M dataset which is a standard dataset for 3D pose estimation. Our model’s performance is close to the state-of-the-art, but with much fewer parameters. The model learns interesting adjacency relations between joints that have no physical connections, but are behaviorally similar.

arxiv情報

著者 Soubarna Banik,Alejandro Mendoza Gracia,Alois Knoll
発行日 2022-12-13 14:50:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク