Optimal Modified Feedback Strategies in LQ Games under Control Imperfections

要約

ゲーム理論的アプローチとナッシュ平衡は、さまざまなエンジニアリングドメインに広く適用されています。
ただし、外乱、遅延、アクチュエータの制限などの実際的な課題は、NASH平衡戦略の正確な実行を妨げる可能性があります。
この作業では、2つのプレイヤー線形二次(LQ)非ゼロサムゲームのコンテキスト内で、ゲームの軌跡とプレイヤーのコストに対するこのような実装の欠陥の影響を調査します。
具体的には、あるプレイヤーによる小さな逸脱が、他のプレイヤーの状態とコスト機能にどのように影響するかを分析します。
これらの逸脱に対処するために、有害作用を最適に軽減するだけでなく、逸脱を活用してパフォーマンスを向上させることができる調整済み制御ポリシーを提案します。
厳密な数学的分析と証明が提示され、提案されたポリシーの変更が、未調整のフィードバックポリシーと比較して最大61ドルの改善を達成し、フィードバックNASH戦略と比較して最大$ 0.59 \%$を達成することを示しています。

要約(オリジナル)

Game-theoretic approaches and Nash equilibrium have been widely applied across various engineering domains. However, practical challenges such as disturbances, delays, and actuator limitations can hinder the precise execution of Nash equilibrium strategies. This work explores the impact of such implementation imperfections on game trajectories and players’ costs within the context of a two-player linear quadratic (LQ) nonzero-sum game. Specifically, we analyze how small deviations by one player affect the state and cost function of the other player. To address these deviations, we propose an adjusted control policy that not only mitigates adverse effects optimally but can also exploit the deviations to enhance performance. Rigorous mathematical analysis and proofs are presented, demonstrating through a representative example that the proposed policy modification achieves up to $61\%$ improvement compared to the unadjusted feedback policy and up to $0.59\%$ compared to the feedback Nash strategy.

arxiv情報

著者 Mahdis Rabbani,Navid Mojahed,Shima Nazari
発行日 2025-03-24 22:56:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.GT, cs.MA, cs.RO, cs.SY, eess.SY, math.OC パーマリンク