要約
歩行者の軌跡予測タスクは、インテリジェント システムの重要なコンポーネントです。
その用途には、自動運転、ロボットナビゲーション、監視システムの異常検出などが含まれますが、これらに限定されません。
運動行動の多様性と歩行者間の複雑な社会的相互作用のため、歩行者の将来の軌道を正確に予測することは困難です。
既存のアプローチでは、一般的に GAN または CVAE を採用して、多様な軌道を生成します。
ただし、GAN ベースの手法は潜在空間内のデータを直接モデル化しないため、基礎となるデータ分散を完全にサポートできない可能性があります。
CVAE ベースの手法では、観測値の対数尤度の下限が最適化されるため、学習された分布が基礎となる分布から逸脱する可能性があります。
上記の制限により、既存のアプローチでは、非常に偏った軌道や不正確な軌道が生成されることがよくあります。
この論文では、歩行者軌道予測 (STGlow) のためのデュアル グラフォーマーを備えた新しい生成フロー ベースのフレームワークを提案します。
以前のアプローチとは異なり、私たちの方法は、動きの動作の正確な対数尤度を最適化することにより、基礎となるデータ分布をより正確にモデル化できます。
さらに、私たちの方法は人間の運動行動の進化をシミュレートするための明確な物理的意味を持っています。
フローの順方向のプロセスは、複雑なモーション動作を徐々に単純な動作に分解しますが、その逆のプロセスは、単純な動作から複雑なモーション動作への進化を表します。
さらに、時間依存性と相互空間相互作用をより適切にモデル化するために、グラフ構造と組み合わせたデュアルグラフォーマを導入します。
いくつかのベンチマークの実験結果は、私たちの方法が以前の最先端のアプローチと比較してはるかに優れたパフォーマンスを達成することを示しています。
要約(オリジナル)
The pedestrian trajectory prediction task is an essential component of intelligent systems. Its applications include but are not limited to autonomous driving, robot navigation, and anomaly detection of monitoring systems. Due to the diversity of motion behaviors and the complex social interactions among pedestrians, accurately forecasting their future trajectory is challenging. Existing approaches commonly adopt GANs or CVAEs to generate diverse trajectories. However, GAN-based methods do not directly model data in a latent space, which may make them fail to have full support over the underlying data distribution; CVAE-based methods optimize a lower bound on the log-likelihood of observations, which may cause the learned distribution to deviate from the underlying distribution. The above limitations make existing approaches often generate highly biased or inaccurate trajectories. In this paper, we propose a novel generative flow based framework with dual graphormer for pedestrian trajectory prediction (STGlow). Different from previous approaches, our method can more precisely model the underlying data distribution by optimizing the exact log-likelihood of motion behaviors. Besides, our method has clear physical meanings for simulating the evolution of human motion behaviors. The forward process of the flow gradually degrades complex motion behavior into simple behavior, while its reverse process represents the evolution of simple behavior into complex motion behavior. Further, we introduce a dual graphormer combining with the graph structure to more adequately model the temporal dependencies and the mutual spatial interactions. Experimental results on several benchmarks demonstrate that our method achieves much better performance compared to previous state-of-the-art approaches.
arxiv情報
著者 | Rongqin Liang,Yuanman Li,Jiantao Zhou,Xia Li |
発行日 | 2023-07-12 08:19:00+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google