要約
群衆の中での人間の軌跡予測は、社会的相互作用をモデル化し、衝突のないマルチモーダル分布を出力するという課題を提示します。
Social Generative Adversarial Networks (SGAN) の成功に続いて、最近の研究では、群衆の中での人間の動きをより適切にモデル化するために、さまざまな GAN ベースの設計が提案されています。
距離ベースのメトリックを削減する優れたパフォーマンスにもかかわらず、現在のネットワークは、モデル予測における高い衝突によって証明されるように、社会的に受け入れられる軌道を出力できません。
これに対抗するために、SGANv2 を導入します。これは、時空間相互作用モデリングと変換器ベースの弁別器を備えた改良された安全準拠の SGAN アーキテクチャです。
時空間モデリング機能は、人間の社会的相互作用をよりよく学習するのに役立ち、トランスベースの弁別器設計は時系列モデリングを改善します。
さらに、SGANv2 は、衝突軌道を改良するだけでなく、GAN トレーニングで一般的な現象であるモード崩壊を防止する共同サンプリング戦略を介して、テスト時でも学習した識別器を利用します。
複数の実世界および合成データセットでの広範な実験を通じて、社会に準拠したマルチモーダル軌道を提供する SGANv2 の有効性を実証します。
要約(オリジナル)
Human trajectory forecasting in crowds presents the challenges of modelling social interactions and outputting collision-free multimodal distribution. Following the success of Social Generative Adversarial Networks (SGAN), recent works propose various GAN-based designs to better model human motion in crowds. Despite superior performance in reducing distance-based metrics, current networks fail to output socially acceptable trajectories, as evidenced by high collisions in model predictions. To counter this, we introduce SGANv2: an improved safety-compliant SGAN architecture equipped with spatio-temporal interaction modelling and a transformer-based discriminator. The spatio-temporal modelling ability helps to learn the human social interactions better while the transformer-based discriminator design improves temporal sequence modelling. Additionally, SGANv2 utilizes the learned discriminator even at test-time via a collaborative sampling strategy that not only refines the colliding trajectories but also prevents mode collapse, a common phenomenon in GAN training. Through extensive experimentation on multiple real-world and synthetic datasets, we demonstrate the efficacy of SGANv2 to provide socially-compliant multimodal trajectories.
arxiv情報
著者 | Parth Kothari,Alexandre Alahi |
発行日 | 2022-11-01 17:56:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google