AdvMT: Adversarial Motion Transformer for Long-term Human Motion Prediction

要約

共有環境でロボットと人間のシームレスなコラボレーションを実現するには、将来の人間の動きを正確に予測することが不可欠です。
人間の動作予測は伝統的に、過去の人間の動作データを活用して将来のポーズを推定するシーケンス予測問題としてアプローチされてきました。
研究コミュニティは、バニラリカレントネットワークから始まり、グラフベースのアプローチや生成的アプローチを含む、人間の動作ダイナミクスを学習するためのさまざまな方法を研究してきました。
こうした取り組みにもかかわらず、正確な長期予測を達成することは依然として大きな課題です。
これに関して、トランスフォーマーベースのモーションエンコーダーと時間的連続性弁別器を統合した新しいモデルである Adversarial Motion Transformer (AdvMT) を紹介します。
この組み合わせにより、フレーム内の空間的依存性と時間的依存性が同時に効果的にキャプチャされます。
敵対的トレーニングを使用することで、私たちの方法は予測における不要なアーティファクトを効果的に削減し、それによってより現実的で流動的な人間の動きの学習を確実にします。
評価結果は、AdvMT が長期予測の精度を大幅に向上させながら、堅牢な短期予測も提供することを示しています。

要約(オリジナル)

To achieve seamless collaboration between robots and humans in a shared environment, accurately predicting future human movements is essential. Human motion prediction has traditionally been approached as a sequence prediction problem, leveraging historical human motion data to estimate future poses. Beginning with vanilla recurrent networks, the research community has investigated a variety of methods for learning human motion dynamics, encompassing graph-based and generative approaches. Despite these efforts, achieving accurate long-term predictions continues to be a significant challenge. In this regard, we present the Adversarial Motion Transformer (AdvMT), a novel model that integrates a transformer-based motion encoder and a temporal continuity discriminator. This combination effectively captures spatial and temporal dependencies simultaneously within frames. With adversarial training, our method effectively reduces the unwanted artifacts in predictions, thereby ensuring the learning of more realistic and fluid human motions. The evaluation results indicate that AdvMT greatly enhances the accuracy of long-term predictions while also delivering robust short-term predictions

arxiv情報

著者 Sarmad Idrees,Jongeun Choi,Seokman Sohn
発行日 2024-02-19 13:58:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク