Context-aware Multi-task Learning for Pedestrian Intent and Trajectory Prediction

要約

社会性を意識した自動運転車の進歩は、人間の行動の正確なモデリングにかかっています。
この幅広いパラダイムの中で、具体的な課題は歩行者の軌跡と意図を正確に予測することにあります。
従来の方法論は、過去の軌跡データに大きく依存しており、歩行者特有の特徴や環境要因などの重要な文脈上の手がかりを見落とすことがよくありました。
さらに、軌道と意図の予測は相互に依存しているにもかかわらず、主に別個の問題として扱われてきたため、顕著な知識のギャップがあります。
このギャップを埋めるために、PTINet (歩行者軌跡および意図予測ネットワーク) を導入します。これは、過去の軌跡観測、ローカルコンテキスト特徴 (個々の歩行者の行動)、およびグローバル特徴 (標識、マーキングなど) を組み合わせることにより、軌跡と意図予測を共同学習します。

私たちのアプローチの有効性は、広く使用されている公開データセットである JAAD と PIE で評価されており、軌道と意図の予測において既存の最先端モデルよりも優れたパフォーマンスを実証しています。
私たちの実験とアブレーション研究の結果は、歩行者行動モデリングの意図と軌道予測を共同で探索する際の PTINet の有効性を確実に検証します。
実験的評価は、歩行者の軌跡と意図の予測にグローバルおよびローカルのコンテキスト特徴を使用する利点を示しています。
歩行者の行動予測における PTINet の有効性により、都市環境で歩行者とシームレスに対話できる自動化システムの開発への道が開かれます。

要約(オリジナル)

The advancement of socially-aware autonomous vehicles hinges on precise modeling of human behavior. Within this broad paradigm, the specific challenge lies in accurately predicting pedestrian’s trajectory and intention. Traditional methodologies have leaned heavily on historical trajectory data, frequently overlooking vital contextual cues such as pedestrian-specific traits and environmental factors. Furthermore, there’s a notable knowledge gap as trajectory and intention prediction have largely been approached as separate problems, despite their mutual dependence. To bridge this gap, we introduce PTINet (Pedestrian Trajectory and Intention Prediction Network), which jointly learns the trajectory and intention prediction by combining past trajectory observations, local contextual features (individual pedestrian behaviors), and global features (signs, markings etc.). The efficacy of our approach is evaluated on widely used public datasets: JAAD and PIE, where it has demonstrated superior performance over existing state-of-the-art models in trajectory and intention prediction. The results from our experiments and ablation studies robustly validate PTINet’s effectiveness in jointly exploring intention and trajectory prediction for pedestrian behaviour modelling. The experimental evaluation indicates the advantage of using global and local contextual features for pedestrian trajectory and intention prediction. The effectiveness of PTINet in predicting pedestrian behavior paves the way for the development of automated systems capable of seamlessly interacting with pedestrians in urban settings.

arxiv情報

著者 Farzeen Munir,Tomasz Piotr Kucner
発行日 2024-07-24 11:06:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク