A Super-human Vision-based Reinforcement Learning Agent for Autonomous Racing in Gran Turismo

要約

人間の最高のドライバーよりも速く自動運転車をレースすることは、人工知能とロボット工学の分野にとって長年にわたる大きな課題でした。
最近、エンドツーエンドの深層強化学習エージェントが、忠実度の高いレーシング シミュレーターであるグランツーリスモでこの課題に対処しました。
ただし、このエージェントは、車の外部の計装を必要とするグローバル機能に依存していました。
この論文では、私たちの知る限り、センサー入力が純粋に車にローカルなもの、つまり自己中心的なカメラの視点からのピクセルと車載から感知できる量を持つ初の超人的なカーレースエージェントを紹介します。
車の速度など。
トレーニング時にのみグローバル機能を活用することで、学習されたエージェントは、ローカル入力機能のみを使用したタイム トライアル (一度にトラック上に 1 台の車) レースで最高の人間ドライバーを上回るパフォーマンスを発揮できます。
結果として得られるエージェントは、グランツーリスモ 7 の複数のトラックと車両で評価されます。
詳細なアブレーション実験により、このエージェントが視覚入力に強く依存していることが実証され、これが視覚ベースの超人カーレースエージェントとして初めて誕生した。

要約(オリジナル)

Racing autonomous cars faster than the best human drivers has been a longstanding grand challenge for the fields of Artificial Intelligence and robotics. Recently, an end-to-end deep reinforcement learning agent met this challenge in a high-fidelity racing simulator, Gran Turismo. However, this agent relied on global features that require instrumentation external to the car. This paper introduces, to the best of our knowledge, the first super-human car racing agent whose sensor input is purely local to the car, namely pixels from an ego-centric camera view and quantities that can be sensed from on-board the car, such as the car’s velocity. By leveraging global features only at training time, the learned agent is able to outperform the best human drivers in time trial (one car on the track at a time) races using only local input features. The resulting agent is evaluated in Gran Turismo 7 on multiple tracks and cars. Detailed ablation experiments demonstrate the agent’s strong reliance on visual inputs, making it the first vision-based super-human car racing agent.

arxiv情報

著者 Miguel Vasco,Takuma Seno,Kenta Kawamoto,Kaushik Subramanian,Peter R. Wurman,Peter Stone
発行日 2024-06-18 12:49:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.RO パーマリンク