要約
自動レースは、物理的な限界でレースカーを制御するという課題を超えて広がります。
プロのレーサーは、勝利を確実にするために他の競合相手を出し抜く戦略的機動を採用します。
最新の制御アルゴリズムは、単一車両のシナリオでオフライン レーシング ラインを計算することで人間レベルのパフォーマンスを達成できますが、複数車両の自動レース用のリアルタイム アルゴリズムに関する研究は限られています。
このギャップを埋めるために、私たちは限界で車を操作しながら、新しいポリシーパラメータ化を通じて追い越しや阻止などの自動レースの競争的側面を組み込んだゲーム理論的モデリングフレームワークを開発します。
さらに、競合エージェントの存在下での最適なアプローチを表す (近似) ナッシュ均衡戦略を計算するためのアルゴリズム アプローチを提案します。
具体的には、最近導入された動的近ポテンシャル関数のフレームワークに触発されたアルゴリズムを導入し、ナッシュ均衡のリアルタイム計算を可能にします。
私たちのアプローチは、オフラインとオンラインの 2 つのフェーズで構成されます。
オフライン段階では、シミュレートされたレーシング データを使用して、エージェントのユーティリティの変化を近似する潜在的な関数を学習します。
この関数は、その値を最大化することにより、近似ナッシュ均衡のオンライン計算を容易にします。
私たちは 3 台の車による直接対決のレース シナリオでメソッドを評価し、いくつかの既存のベースラインと比較して優れたパフォーマンスを実証しました。
要約(オリジナル)
Autonomous racing extends beyond the challenge of controlling a racecar at its physical limits. Professional racers employ strategic maneuvers to outwit other competing opponents to secure victory. While modern control algorithms can achieve human-level performance by computing offline racing lines for single-car scenarios, research on real-time algorithms for multi-car autonomous racing is limited. To bridge this gap, we develop game-theoretic modeling framework that incorporates the competitive aspect of autonomous racing like overtaking and blocking through a novel policy parametrization, while operating the car at its limit. Furthermore, we propose an algorithmic approach to compute the (approximate) Nash equilibrium strategy, which represents the optimal approach in the presence of competing agents. Specifically, we introduce an algorithm inspired by recently introduced framework of dynamic near-potential function, enabling real-time computation of the Nash equilibrium. Our approach comprises two phases: offline and online. During the offline phase, we use simulated racing data to learn a near-potential function that approximates utility changes for agents. This function facilitates the online computation of approximate Nash equilibria by maximizing its value. We evaluate our method in a head-to-head 3-car racing scenario, demonstrating superior performance compared to several existing baselines.
arxiv情報
著者 | Dvij Kalaria,Chinmay Maheshwari,Shankar Sastry |
発行日 | 2024-12-12 01:29:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google