BehaviorGPT: Smart Agent Simulation for Autonomous Driving with Next-Patch Prediction

要約

交通エージェントの現実的な動作をシミュレーションすることは、自動運転システムの安全性を効率的に検証するために極めて重要です。
既存のデータ駆動型シミュレータは、主にエンコーダ/デコーダ アーキテクチャを使用して、将来をデコードする前に過去の軌跡をエンコードします。
ただし、エンコーダーとデコーダー間の異質性によりモデルが複雑になり、過去の軌跡と将来の軌跡を手動で分離するとデータ使用率が低下します。
これらの制限を考慮して、複数のエージェントの逐次動作をシミュレートするように設計された均一で完全に自己回帰的な Transformer である BehaviorGPT を提案します。
重要なのは、私たちのアプローチは、各タイム ステップをモーション生成の「現在」のタイム ステップとしてモデル化することにより、「履歴」と「未来」の間の従来の分離を破棄し、よりシンプルでパラメータとデータの効率がより高いエージェント シミュレータを実現することです。
さらに、自己回帰モデリングの悪影響を軽減するために、次パッチ予測パラダイム (NP3) を導入します。このパラダイムでは、軌道のパッチ レベルで推論し、長距離の時空間相互作用を捕捉するようにモデルがトレーニングされます。
BehaviorGPT は、モデル パラメーターが 3M しかないにもかかわらず、2024 Waymo Open Sim Agents Challenge でリアリズム スコア 0.7473、minADE スコア 1.4147 で 1 位を獲得し、交通エージェント シミュレーションにおける卓越したパフォーマンスを実証しました。

要約(オリジナル)

Simulating realistic behaviors of traffic agents is pivotal for efficiently validating the safety of autonomous driving systems. Existing data-driven simulators primarily use an encoder-decoder architecture to encode the historical trajectories before decoding the future. However, the heterogeneity between encoders and decoders complicates the models, and the manual separation of historical and future trajectories leads to low data utilization. Given these limitations, we propose BehaviorGPT, a homogeneous and fully autoregressive Transformer designed to simulate the sequential behavior of multiple agents. Crucially, our approach discards the traditional separation between ‘history’ and ‘future’ by modeling each time step as the ‘current’ one for motion generation, leading to a simpler, more parameter- and data-efficient agent simulator. We further introduce the Next-Patch Prediction Paradigm (NP3) to mitigate the negative effects of autoregressive modeling, in which models are trained to reason at the patch level of trajectories and capture long-range spatial-temporal interactions. Despite having merely 3M model parameters, BehaviorGPT won first place in the 2024 Waymo Open Sim Agents Challenge with a realism score of 0.7473 and a minADE score of 1.4147, demonstrating its exceptional performance in traffic agent simulation.

arxiv情報

著者 Zikang Zhou,Haibo Hu,Xinhong Chen,Jianping Wang,Nan Guan,Kui Wu,Yung-Hui Li,Yu-Kai Huang,Chun Jason Xue
発行日 2024-11-11 14:20:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク