Learning Pedestrian Group Representations for Multi-modal Trajectory Prediction

要約

歩く人々のダイナミクスをモデル化することは、コンピュータビジョンに対する長年の関心の問題です。
歩行者の軌道予測を含むこれまでの多くの研究では、グループアクションを暗黙的にモデル化するために、特定の一連の個々のアクションを定義しています。
この論文では、混雑した環境で効果的な歩行者軌道予測のための集合的なグループ表現を持ち、すべてのタイプの既存のアプローチと互換性があるGP-Graphという名前の新しいアーキテクチャを提示します。
GP-Graphの重要なアイデアは、個人ごとの関係とグループごとの関係の両方をグラフ表現としてモデル化することです。
これを行うために、GP-Graphは最初に、各歩行者を最も可能性の高い行動グループに割り当てることを学習します。
次に、この割り当て情報を使用して、GP-Graphは、グループ内およびグループ間の相互作用の両方をグラフとして形成し、それぞれグループ内の人間と人間の関係およびグループとグループの関係を説明します。
具体的には、グループ内の相互作用について、関連するグループから歩行者グラフのエッジをマスクします。
また、複数の歩行者がいるグループを1つのグラフノードとして表すために、グループのプーリングとアンプーリングの操作を提案します。
最後に、GP-Graphは、両方のグループの相互作用の統合された機能から、社会的に受け入れられる将来の軌道の確率マップを推測します。
さらに、グループレベルの潜在ベクトルサンプリングを導入して、一連の可能な将来の軌道に対する集合的な推論を保証します。
アーキテクチャの有効性を検証するために広範な実験が行われ、公開されているベンチマークで一貫したパフォーマンスの向上が実証されています。
コードはhttps://github.com/inhwanbae/GPGraphで公開されています。

要約(オリジナル)

Modeling the dynamics of people walking is a problem of long-standing interest in computer vision. Many previous works involving pedestrian trajectory prediction define a particular set of individual actions to implicitly model group actions. In this paper, we present a novel architecture named GP-Graph which has collective group representations for effective pedestrian trajectory prediction in crowded environments, and is compatible with all types of existing approaches. A key idea of GP-Graph is to model both individual-wise and group-wise relations as graph representations. To do this, GP-Graph first learns to assign each pedestrian into the most likely behavior group. Using this assignment information, GP-Graph then forms both intra- and inter-group interactions as graphs, accounting for human-human relations within a group and group-group relations, respectively. To be specific, for the intra-group interaction, we mask pedestrian graph edges out of an associated group. We also propose group pooling&unpooling operations to represent a group with multiple pedestrians as one graph node. Lastly, GP-Graph infers a probability map for socially-acceptable future trajectories from the integrated features of both group interactions. Moreover, we introduce a group-level latent vector sampling to ensure collective inferences over a set of possible future trajectories. Extensive experiments are conducted to validate the effectiveness of our architecture, which demonstrates consistent performance improvements with publicly available benchmarks. Code is publicly available at https://github.com/inhwanbae/GPGraph.

arxiv情報

著者 Inhwan Bae,Jin-Hwi Park,Hae-Gon Jeon
発行日 2022-07-20 14:58:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.RO パーマリンク