Auto-Encoding Bayesian Inverse Games

要約

複数のエージェントが共通の環境で対話する場合、各エージェントの行動は他のエージェントの将来の決定に影響を与え、非協力的な動的ゲームはこの結合を自然に捉えます。
ただし、インタラクティブなモーション プランニングでは、他のプレーヤーの目的が不明なため、エージェントは通常、ゲームの完全なモデルにアクセスできません。
したがって、ゲームの一部の特性がアプリオリに不明であり、観察から推測する必要があるという逆ゲーム問題を検討します。
逆ゲームを解くための既存の最尤推定 (MLE) アプローチは、不確実性を定量化せずに未知のパラメーターの点推定のみを提供し、多くのパラメーター値が観察された動作を説明する場合にはパフォーマンスが低下します。
これらの制限に対処するために、ベイジアンの観点を採用し、ゲーム パラメーターの事後分布を構築します。
推論を扱いやすくするために、微分可能なゲーム ソルバーが組み込まれた変分オートエンコーダー (VAE) を採用しています。
この構造化 VAE は、観察されたインタラクションのラベルなしデータセットからトレーニングでき、連続的なマルチモーダル分布を自然に処理し、実行時にゲーム ソリューションを計算することなく、推論された事後分布からの効率的なサンプリングをサポートします。
シミュレートされた運転シナリオでの広範な評価により、提案されたアプローチが事前および事後の目標分布を首尾よく学習し、MLE ベースラインよりも正確な目標推定値を提供し、より安全で効率的なゲーム理論的な動作計画を促進することが実証されました。

要約(オリジナル)

When multiple agents interact in a common environment, each agent’s actions impact others’ future decisions, and noncooperative dynamic games naturally capture this coupling. In interactive motion planning, however, agents typically do not have access to a complete model of the game, e.g., due to unknown objectives of other players. Therefore, we consider the inverse game problem, in which some properties of the game are unknown a priori and must be inferred from observations. Existing maximum likelihood estimation (MLE) approaches to solve inverse games provide only point estimates of unknown parameters without quantifying uncertainty, and perform poorly when many parameter values explain the observed behavior. To address these limitations, we take a Bayesian perspective and construct posterior distributions of game parameters. To render inference tractable, we employ a variational autoencoder (VAE) with an embedded differentiable game solver. This structured VAE can be trained from an unlabeled dataset of observed interactions, naturally handles continuous, multi-modal distributions, and supports efficient sampling from the inferred posteriors without computing game solutions at runtime. Extensive evaluations in simulated driving scenarios demonstrate that the proposed approach successfully learns the prior and posterior objective distributions, provides more accurate objective estimates than MLE baselines, and facilitates safer and more efficient game-theoretic motion planning.

arxiv情報

著者 Xinjie Liu,Lasse Peters,Javier Alonso-Mora,Ufuk Topcu,David Fridovich-Keil
発行日 2024-02-14 02:17:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.GT, cs.LG, cs.MA, cs.RO, cs.SY, eess.SY パーマリンク