α-RACER: Real-Time Algorithm for Game-Theoretic Motion Planning and Control in Autonomous Racing using Near-Potential Function

要約

自律的なレースは、その物理的な限界でレースカーを制御するという課題を超えています。
プロのレーサーは、戦略的な操作を採用して、勝利を確保するために他の競合する敵を追い越します。
最新のコントロールアルゴリズムは、単一車シナリオのオフラインレースラインを計算することにより、人間レベルのパフォーマンスを実現できますが、マルチカーの自律レースのリアルタイムアルゴリズムに関する研究は限られています。
このギャップを埋めるために、私たちは、その限界で車を操作しながら、新しい政策パラメーター化を追い越してブロックするなど、自律レースの競争的側面を組み込んだゲーム理論モデリングフレームワークを開発します。
さらに、競合するエージェントの存在下での最適なアプローチを表す(近似)ナッシュ平衡戦略を計算するためのアルゴリズムアプローチを提案します。
具体的には、最近導入された動的近電位関数のフレームワークに触発されたアルゴリズムを導入し、NASH平衡のリアルタイム計算を可能にします。
私たちのアプローチは、オフラインとオンラインの2つのフェーズで構成されています。
オフラインフェーズでは、シミュレートされたレーシングデータを使用して、エージェントのユーティリティの変化に近似する近接関数を学習します。
この関数は、その価値を最大化することにより、近似ナッシュ平衡のオンライン計算を容易にします。
私たちは、いくつかの既存のベースラインと比較して優れたパフォーマンスを実証する、直接的な3台の車のレースシナリオで方法を評価します。

要約(オリジナル)

Autonomous racing extends beyond the challenge of controlling a racecar at its physical limits. Professional racers employ strategic maneuvers to outwit other competing opponents to secure victory. While modern control algorithms can achieve human-level performance by computing offline racing lines for single-car scenarios, research on real-time algorithms for multi-car autonomous racing is limited. To bridge this gap, we develop game-theoretic modeling framework that incorporates the competitive aspect of autonomous racing like overtaking and blocking through a novel policy parametrization, while operating the car at its limit. Furthermore, we propose an algorithmic approach to compute the (approximate) Nash equilibrium strategy, which represents the optimal approach in the presence of competing agents. Specifically, we introduce an algorithm inspired by recently introduced framework of dynamic near-potential function, enabling real-time computation of the Nash equilibrium. Our approach comprises two phases: offline and online. During the offline phase, we use simulated racing data to learn a near-potential function that approximates utility changes for agents. This function facilitates the online computation of approximate Nash equilibria by maximizing its value. We evaluate our method in a head-to-head 3-car racing scenario, demonstrating superior performance compared to several existing baselines.

arxiv情報

著者 Dvij Kalaria,Chinmay Maheshwari,Shankar Sastry
発行日 2025-04-24 20:18:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.GT, cs.RO パーマリンク