要約
我々は、自律走行のためのスケーラブルな行動モデルであるDriveGPTを発表する。我々は、運転を逐次的な意思決定タスクとしてモデル化し、将来のエージェントの状態をトークンとして自己回帰的に予測する変換モデルを学習する。モデルパラメータと学習データを数桁スケールアップし、データセットサイズ、モデルパラメータ、計算量のスケーリング特性を探索する。DriveGPTは、複雑な実世界のシナリオにおける閉ループ運転を含む定量的な指標と定性的な例の両方を通して、計画タスクにおいて異なるスケールにわたって評価されます。別の予測タスクでは、DriveGPTは最先端のベースラインを上回り、大規模データセットで事前学習することで性能が向上することを示し、データスケーリングの利点をさらに検証した。
要約(オリジナル)
We present DriveGPT, a scalable behavior model for autonomous driving. We model driving as a sequential decision-making task, and learn a transformer model to predict future agent states as tokens in an autoregressive fashion. We scale up our model parameters and training data by multiple orders of magnitude, enabling us to explore the scaling properties in terms of dataset size, model parameters, and compute. We evaluate DriveGPT across different scales in a planning task, through both quantitative metrics and qualitative examples, including closed-loop driving in complex real-world scenarios. In a separate prediction task, DriveGPT outperforms state-of-the-art baselines and exhibits improved performance by pretraining on a large-scale dataset, further validating the benefits of data scaling.
arxiv情報
| 著者 | Xin Huang,Eric M. Wolff,Paul Vernaza,Tung Phan-Minh,Hongge Chen,David S. Hayden,Mark Edmonds,Brian Pierce,Xinxin Chen,Pratik Elias Jacob,Xiaobai Chen,Chingiz Tairbekov,Pratik Agarwal,Tianshi Gao,Yuning Chai,Siddhartha Srinivasa |
| 発行日 | 2025-05-02 01:02:47+00:00 |
| arxivサイト | arxiv_id(pdf) |