要約
自動運転のためのスケーラブルな動作モデルである DriveGPT を紹介します。
運転を逐次的な意思決定タスクとしてモデル化し、トランスフォーマー モデルを学習して、自己回帰方式で将来のエージェントの状態をトークンとして予測します。
モデル パラメーターとトレーニング データを何桁もスケールアップして、データセット サイズ、モデル パラメーター、コンピューティングの観点からスケーリング プロパティを調査できるようにします。
私たちは、定量的な指標と、複雑な現実世界のシナリオにおける閉ループ運転などの定性的な例の両方を通じて、計画タスクのさまざまなスケールにわたって DriveGPT を評価します。
別の予測タスクでは、DriveGPT は最先端のベースラインを上回り、大規模なデータセットでの事前トレーニングによってパフォーマンスの向上を示し、データ スケーリングの利点をさらに検証します。
要約(オリジナル)
We present DriveGPT, a scalable behavior model for autonomous driving. We model driving as a sequential decision making task, and learn a transformer model to predict future agent states as tokens in an autoregressive fashion. We scale up our model parameters and training data by multiple orders of magnitude, enabling us to explore the scaling properties in terms of dataset size, model parameters, and compute. We evaluate DriveGPT across different scales in a planning task, through both quantitative metrics and qualitative examples including closed-loop driving in complex real-world scenarios. In a separate prediction task, DriveGPT outperforms a state-of-the-art baseline and exhibits improved performance by pretraining on a large-scale dataset, further validating the benefits of data scaling.
arxiv情報
著者 | Xin Huang,Eric M. Wolff,Paul Vernaza,Tung Phan-Minh,Hongge Chen,David S. Hayden,Mark Edmonds,Brian Pierce,Xinxin Chen,Pratik Elias Jacob,Xiaobai Chen,Chingiz Tairbekov,Pratik Agarwal,Tianshi Gao,Yuning Chai,Siddhartha Srinivasa |
発行日 | 2024-12-19 00:06:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google