Disentangled Neural Relational Inference for Interpretable Motion Prediction


既存の手法により予測精度は向上しましたが、予測モデルの解釈可能性と分布外 (OOD) 一般化可能性の向上に重点を置いた研究はほとんど行われていません。
この研究では、グラフベースの表現と時系列モデルを統合する変分オートエンコーダー フレームワークを設計することで、これら 2 つの困難な側面に対処し、インタラクティブ エージェント間の時空間関係を効率的に捕捉し、そのダイナミクスを予測します。
さらに、エッジ特徴の潜在空間を解きほぐすことで、OOD シナリオにおけるモデルの解釈可能性とパフォーマンスを強化し、それによってモデルの汎用性と堅牢性を強化することを目指しています。


Effective interaction modeling and behavior prediction of dynamic agents play a significant role in interactive motion planning for autonomous robots. Although existing methods have improved prediction accuracy, few research efforts have been devoted to enhancing prediction model interpretability and out-of-distribution (OOD) generalizability. This work addresses these two challenging aspects by designing a variational auto-encoder framework that integrates graph-based representations and time-sequence models to efficiently capture spatio-temporal relations between interactive agents and predict their dynamics. Our model infers dynamic interaction graphs in a latent space augmented with interpretable edge features that characterize the interactions. Moreover, we aim to enhance model interpretability and performance in OOD scenarios by disentangling the latent space of edge features, thereby strengthening model versatility and robustness. We validate our approach through extensive experiments on both simulated and real-world datasets. The results show superior performance compared to existing methods in modeling spatio-temporal relations, motion prediction, and identifying time-invariant latent features.


著者 Victoria M. Dax,Jiachen Li,Enna Sachdeva,Nakul Agarwal,Mykel J. Kochenderfer
発行日 2024-01-07 22:49:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク