Inferring Short-Sightedness in Dynamic Noncooperative Games

要約

動的ゲーム理論は、マルチエージェントをモデリングするためのますます人気のあるツールです。
ヒューマンロボット、相互作用。
ゲーム理論モデルは、各エージェントが他者の行動に依存するプライベートコスト関数を最小限に抑えたいと考えています。
これらのゲームは通常、固定期間にわたって進化し、各エージェントが将来の計画を立てています。
ただし、実際の設定では、意思決定者の近視が異なる場合があります。
オンラインデータから各エージェントの先見性を定量化および推定することで、他のエージェントとより安全で効率的な相互作用が可能になると推測します。
この目的のために、この推論の問題を\ end {inverse}動的ゲームとしてフレーム化します。
近視および先見の明のある計画をスムーズに補間する各エージェントの目的関数の特定のパラメーター化を検討します。
このフォームのゲームは、パラメトリックな混合相補性の問題に容易に変換されます。
私たちは、エージェントの先見性を解決するために、それらの隠されたパラメーターに関して、これらの問題に対する解決策の方向性の違いを活用します。
2種類の実験を実施します。1つは横断歩道で合成された歩行者の動きを、もう1つは歩行、自転車、運転車を含む現実世界の交差データを使用しています。
これらの実験の結果は、エージェントの先見性を明示的に推測することにより、ゲーム理論モデルがエージェントの動作をより正確にモデル化することを可能にすることを示しています。
具体的には、我々の結果は、実際のシナリオのベースラインと比較して、平均して予測された行動の33%の正確な予測を示しています。

要約(オリジナル)

Dynamic game theory is an increasingly popular tool for modeling multi-agent, e.g. human-robot, interactions. Game-theoretic models presume that each agent wishes to minimize a private cost function that depends on others’ actions. These games typically evolve over a fixed time horizon, specifying how far into the future each agent plans. In practical settings, however, decision-makers may vary in foresightedness. We conjecture that quantifying and estimating each agent’s foresightedness from online data will enable safer and more efficient interactions with other agents. To this end, we frame this inference problem as an \emph{inverse} dynamic game. We consider a specific parametrization of each agent’s objective function that smoothly interpolates myopic and farsighted planning. Games of this form are readily transformed into parametric mixed complementarity problems; we exploit the directional differentiability of solutions to these problems with respect to their hidden parameters to solve for agents’ foresightedness. We conduct two types of experiments: one with synthetically generated pedestrian motion at a crosswalk and the other with real-world intersection data involving people walking, biking, and driving vehicles. The results of these experiments demonstrate that explicitly inferring agents’ foresightedness enables game-theoretic models to more accurately model agents’ behavior. Specifically, our results show 33% more accurate prediction of foresighted behavior on average compared to the baseline in real-world scenarios.

arxiv情報

著者 Cade Armstrong,Ryan Park,Xinjie Liu,Kushagra Gupta,David Fridovich-Keil
発行日 2025-04-16 01:31:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.GT, cs.MA, cs.RO, cs.SY, eess.SY パーマリンク