DriveGPT: Scaling Autoregressive Behavior Models for Driving

要約

自律運転のスケーラブルな動作モデルであるDriveGPTを提示します。
運転を連続的な意思決定タスクとしてモデル化し、変圧器モデルを学習して、将来のエージェント状態を自己回帰的な方法でトークンとして予測します。
モデルパラメーターとトレーニングデータを複数桁スケールアップし、データセットサイズ、モデルパラメーター、および計算の観点からスケーリングプロパティを調査できるようにします。
複雑な現実世界のシナリオでの閉ループ運転など、定量的メトリックと定性的例の両方を通じて、計画タスクのさまざまなスケールにわたってDriveGPTを評価します。
別の予測タスクでは、DriveGPTは最先端のベースラインよりも優れており、大規模なデータセットで事前に削除することでパフォーマンスの向上を示し、データスケーリングの利点をさらに検証します。

要約(オリジナル)

We present DriveGPT, a scalable behavior model for autonomous driving. We model driving as a sequential decision-making task, and learn a transformer model to predict future agent states as tokens in an autoregressive fashion. We scale up our model parameters and training data by multiple orders of magnitude, enabling us to explore the scaling properties in terms of dataset size, model parameters, and compute. We evaluate DriveGPT across different scales in a planning task, through both quantitative metrics and qualitative examples, including closed-loop driving in complex real-world scenarios. In a separate prediction task, DriveGPT outperforms state-of-the-art baselines and exhibits improved performance by pretraining on a large-scale dataset, further validating the benefits of data scaling.

arxiv情報

著者 Xin Huang,Eric M. Wolff,Paul Vernaza,Tung Phan-Minh,Hongge Chen,David S. Hayden,Mark Edmonds,Brian Pierce,Xinxin Chen,Pratik Elias Jacob,Xiaobai Chen,Chingiz Tairbekov,Pratik Agarwal,Tianshi Gao,Yuning Chai,Siddhartha Srinivasa
発行日 2025-02-12 05:41:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク