要約
ゲーム理論モデルは、特にロボットが人間と調整する必要がある場合、マルチエージェント相互作用をモデル化するための効果的なツールです。
ただし、これらのモデルを適用するには、観測された動作から仕様を推測する必要があります。これは、逆ゲームの問題として知られる挑戦的なタスクです。
既存の逆ゲームアプローチは、行動の不確実性と測定ノイズを説明し、オフラインデータとオンラインデータの両方を活用するのに苦労しています。
これらの制限に対処するために、生成的軌道モデルを微分可能な混合戦略ゲームフレームワークに統合する逆ゲーム方法を提案します。
混合戦略を条件付き変異オートエンコーダー(CVAE)と表現することにより、我々の方法は、リアルタイムで新しい観測に適応しながら、騒々しい測定から高次元のマルチモーダルな動作分布を推測できます。
シミュレートされたナビゲーションベンチマークでメソッドを広範囲に評価します。そこでは、未知のゲームモデルによって観測が生成されます。
モデルの不一致にもかかわらず、私たちの方法は、不確実なエージェントの目的や騒々しい測定が存在する場合でも、グラウンドトゥルースモデルおよびOracle逆ゲームベースラインのアクションに匹敵するナッシュ最適なアクションを推測できます。
要約(オリジナル)
Game-theoretic models are effective tools for modeling multi-agent interactions, especially when robots need to coordinate with humans. However, applying these models requires inferring their specifications from observed behaviors — a challenging task known as the inverse game problem. Existing inverse game approaches often struggle to account for behavioral uncertainty and measurement noise, and leverage both offline and online data. To address these limitations, we propose an inverse game method that integrates a generative trajectory model into a differentiable mixed-strategy game framework. By representing the mixed strategy with a conditional variational autoencoder (CVAE), our method can infer high-dimensional, multi-modal behavior distributions from noisy measurements while adapting in real-time to new observations. We extensively evaluate our method in a simulated navigation benchmark, where the observations are generated by an unknown game model. Despite the model mismatch, our method can infer Nash-optimal actions comparable to those of the ground-truth model and the oracle inverse game baseline, even in the presence of uncertain agent objectives and noisy measurements.
arxiv情報
著者 | Max Muchen Sun,Pete Trautman,Todd Murphey |
発行日 | 2025-02-05 16:53:34+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google