要約
我々は、複数のエージェントの将来の軌道の共同分布のための拡散に基づく表現であるMotionDiffuserを提示する。このような表現にはいくつかの重要な利点がある。第一に、我々のモデルは多様な将来の結果を捕らえる高度なマルチモーダル分布を学習する。第二に、シンプルな予測器設計は、単一のL2損失学習目的のみを必要とし、軌跡アンカーに依存しない。第三に、本モデルは、順列不変の方法で複数のエージェントの運動に関する共同分布を学習することが可能である。さらに、PCAによる圧縮された軌跡表現を利用することで、モデル性能を向上させ、正確なサンプル対数確率の効率的な計算を可能にする。続いて、微分可能なコスト関数に基づいて制御された軌跡のサンプリングを可能にする一般的な制約付きサンプリングの枠組みを提案する。この戦略により、ルールや物理的プリオールの適用、またはカスタマイズされたシミュレーションシナリオの作成など、多くの応用が可能になります。MotionDiffuserは、既存のバックボーンアーキテクチャと組み合わせることで、最高の運動予測結果を得ることができます。Waymo Open Motion Datasetにおいて、マルチエージェントによる運動予測で最先端の結果を得ることができました。
要約(オリジナル)
We present MotionDiffuser, a diffusion based representation for the joint distribution of future trajectories over multiple agents. Such representation has several key advantages: first, our model learns a highly multimodal distribution that captures diverse future outcomes. Second, the simple predictor design requires only a single L2 loss training objective, and does not depend on trajectory anchors. Third, our model is capable of learning the joint distribution for the motion of multiple agents in a permutation-invariant manner. Furthermore, we utilize a compressed trajectory representation via PCA, which improves model performance and allows for efficient computation of the exact sample log probability. Subsequently, we propose a general constrained sampling framework that enables controlled trajectory sampling based on differentiable cost functions. This strategy enables a host of applications such as enforcing rules and physical priors, or creating tailored simulation scenarios. MotionDiffuser can be combined with existing backbone architectures to achieve top motion forecasting results. We obtain state-of-the-art results for multi-agent motion prediction on the Waymo Open Motion Dataset.
arxiv情報
| 著者 | Chiyu Max Jiang,Andre Cornman,Cheolho Park,Ben Sapp,Yin Zhou,Dragomir Anguelov |
| 発行日 | 2023-06-05 17:55:52+00:00 |
| arxivサイト | arxiv_id(pdf) |