要約
3D 複数人の動作予測は、個人の行動と人々の間の相互作用のモデル化を伴う困難なタスクです。
このタスクに対するアプローチが出現しているにもかかわらず、標準化されたトレーニング設定やベンチマーク データセットが不足しているため、それらを比較することは困難です。
この論文では、モーション キャプチャ システムによって収集され、ゲーム エンジンを使用して洗練および合成された複数の個人のスケルトン シーケンスを含む、マルチパーソン インタラクション モーション (MI-Motion) データセットを紹介します。
このデータセットには、対話する人々のスケルトン ポーズの 167,000 フレームが含まれており、5 つの異なるアクティビティ シーンに分類されています。
複数人の動き予測の研究を促進するために、短期予測、長期予測、超長期予測の 3 つの設定で予測手法のパフォーマンスを評価するベンチマークも提供しています。
さらに、グラフと時間畳み込みネットワークを活用した新しいベースライン アプローチを導入します。これは、複数人の動作予測において競合する結果を実証しています。
私たちは、提案された MI-Motion ベンチマーク データセットとベースラインがこの分野での将来の研究を促進し、最終的には複数人のインタラクションのより良い理解とモデリングにつながると信じています。
要約(オリジナル)
3D multi-person motion prediction is a challenging task that involves modeling individual behaviors and interactions between people. Despite the emergence of approaches for this task, comparing them is difficult due to the lack of standardized training settings and benchmark datasets. In this paper, we introduce the Multi-Person Interaction Motion (MI-Motion) Dataset, which includes skeleton sequences of multiple individuals collected by motion capture systems and refined and synthesized using a game engine. The dataset contains 167k frames of interacting people’s skeleton poses and is categorized into 5 different activity scenes. To facilitate research in multi-person motion prediction, we also provide benchmarks to evaluate the performance of prediction methods in three settings: short-term, long-term, and ultra-long-term prediction. Additionally, we introduce a novel baseline approach that leverages graph and temporal convolutional networks, which has demonstrated competitive results in multi-person motion prediction. We believe that the proposed MI-Motion benchmark dataset and baseline will facilitate future research in this area, ultimately leading to better understanding and modeling of multi-person interactions.
arxiv情報
著者 | Xiaogang Peng,Xiao Zhou,Yikai Luo,Hao Wen,Yu Ding,Zizhao Wu |
発行日 | 2023-06-23 15:38:22+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google