Who Plays First? Optimizing the Order of Play in Stackelberg Games with Many Robots

要約

我々は、社会的に最適なプレイの順序、つまり、エージェントが自分の決定にコミットする順序と、N プレイヤーのシュタッケルベルク軌道ゲームにおけるそれに関連する平衡を計算するマルチエージェントの空間ナビゲーション問題を検討します。
この問題を、プレイの順列に関連付けられたすべての可能なシュタッケルベルク ゲームの空間にわたる混合整数最適化問題としてモデル化します。
この問題を解決するために、社会的に最適な遊びの順序とそのシュタッケルベルク均衡に収束することが証明されている効率的で正確なアルゴリズムであるブランチ アンド プレイ (B&P) を導入します。
B&P のサブルーチンとして、我々は逐次軌道計画、つまり一般的なマルチエージェント制御アプローチを採用および拡張して、任意のプレイ順序に対して有効な局所シュタッケルベルク均衡をスケーラブルに計算します。
私たちは、航空交通管制、群れの編隊、配送車両群を調整するための B&P の実用性を実証します。
B&P はさまざまなベースラインを常に上回り、社会的に最適な均衡を計算していることがわかりました。

要約(オリジナル)

We consider the multi-agent spatial navigation problem of computing the socially optimal order of play, i.e., the sequence in which the agents commit to their decisions, and its associated equilibrium in an N-player Stackelberg trajectory game. We model this problem as a mixed-integer optimization problem over the space of all possible Stackelberg games associated with the order of play’s permutations. To solve the problem, we introduce Branch and Play (B&P), an efficient and exact algorithm that provably converges to a socially optimal order of play and its Stackelberg equilibrium. As a subroutine for B&P, we employ and extend sequential trajectory planning, i.e., a popular multi-agent control approach, to scalably compute valid local Stackelberg equilibria for any given order of play. We demonstrate the practical utility of B&P to coordinate air traffic control, swarm formation, and delivery vehicle fleets. We find that B&P consistently outperforms various baselines, and computes the socially optimal equilibrium.

arxiv情報

著者 Haimin Hu,Gabriele Dragotto,Zixu Zhang,Kaiqu Liang,Bartolomeo Stellato,Jaime F. Fisac
発行日 2024-04-28 23:35:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO, cs.SY, eess.SY, math.OC パーマリンク