A Data-Efficient Approach for Long-Term Human Motion Prediction Using Maps of Dynamics


一般的に使用されるニューラル ネットワーク ベースのアプローチでは、多くの場合、複雑な意味論的に豊富な空間でモーション ダイナミクスを表現するために大量の完全な軌跡が必要になります。
この要件により、特にデータがオンボード センサーからオンラインで収集される場合、新しい環境での物理システムの展開が複雑になる可能性があります。
この論文では、以前の観察から学習した場所依存のマルチモーダル空間運動パターンを表現するために、ダイナミクス マップ (MoD) を使用したデータ効率の高い代替案を検討します。
私たちのアプローチは、最大 60 秒の長期的な視点で効率的な人の動作予測を実行できます。
LSTM ベースのベースラインと比較して、限られた量のトレーニング データを使用してその精度を定量的に評価し、予測された軌跡が環境の自然な意味論的特性を反映していることを定性的に示します。


Human motion prediction is essential for the safe and smooth operation of mobile service robots and intelligent vehicles around people. Commonly used neural network-based approaches often require large amounts of complete trajectories to represent motion dynamics in complex semantically-rich spaces. This requirement may complicate deployment of physical systems in new environments, especially when the data is being collected online from onboard sensors. In this paper we explore a data-efficient alternative using maps of dynamics (MoD) to represent place-dependent multi-modal spatial motion patterns, learned from prior observations. Our approach can perform efficient human motion prediction in the long-term perspective of up to 60 seconds. We quantitatively evaluate its accuracy with limited amount of training data in comparison to an LSTM-based baseline, and qualitatively show that the predicted trajectories reflect the natural semantic properties of the environment, e.g. the locations of short- and long-term goals, navigation in narrow passages, around obstacles, etc.


著者 Yufei Zhu,Andrey Rudenko,Tomasz P. Kucner,Achim J. Lilienthal,Martin Magnusson
発行日 2023-06-06 12:12:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク