Mixed-Strategy Nash Equilibrium for Crowd Navigation

要約

群集ナビゲーションのための混合戦略ナッシュ均衡を見つける問題に取り組みます。
混合戦略ナッシュ均衡は、ロボットが群衆の中で不確実だが協力的な人間の行動を予測するための厳密なモデルを提供しますが、多くの場合、スケーラブルでリアルタイムの意思決定を行うには計算コストが高すぎます。
ここでは、単純な反復ベイズ更新スキームが混合戦略ソーシャル ナビゲーション ゲームのナッシュ均衡に収束することを証明します。
さらに、人間のデータセットから学習したガウスプロセスとしてエージェント戦略を初期化することでゲームを構築するデータ駆動型フレームワークを提案します。
提案された混合戦略ナッシュ均衡モデルに基づいて、既存のナビゲーション方法に統合でき、ラップトップ CPU 上でリアルタイムで実行できるサンプリングベースの群衆ナビゲーション フレームワークを開発します。
私たちは、シミュレーション環境と非構造化環境における現実世界の人間データセットの両方でフレームワークを評価します。
私たちのフレームワークは、安全性とナビゲーション効率の両方で非学習ベースの方法と学習ベースの方法の両方を常に上回っており、メタ プランナーの上で人間レベルの群衆ナビゲーション パフォーマンスに達します。

要約(オリジナル)

We address the problem of finding mixed-strategy Nash equilibrium for crowd navigation. Mixed-strategy Nash equilibrium provides a rigorous model for the robot to anticipate uncertain yet cooperative human behavior in crowds, but the computation cost is often too high for scalable and real-time decision-making. Here we prove that a simple iterative Bayesian updating scheme converges to the Nash equilibrium of a mixed-strategy social navigation game. Furthermore, we propose a data-driven framework to construct the game by initializing agent strategies as Gaussian processes learned from human datasets. Based on the proposed mixed-strategy Nash equilibrium model, we develop a sampling-based crowd navigation framework that can be integrated into existing navigation methods and runs in real-time on a laptop CPU. We evaluate our framework in both simulated environments and real-world human datasets in unstructured environments. Our framework consistently outperforms both non-learning and learning-based methods on both safety and navigation efficiency and reaches human-level crowd navigation performance on top of a meta-planner.

arxiv情報

著者 Muchen Sun,Francesca Baldini,Peter Trautman,Todd Murphey
発行日 2024-03-05 15:48:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.GT, cs.LG, cs.RO パーマリンク