Distributed Differentiable Dynamic Game for Multi-robot Coordination

要約

この論文では、複数のロボットの協調における順問題と逆問題を効率的に解決できる分散微分可能ダイナミック ゲーム (D3G) フレームワークを開発します。
私たちは、複数のロボットの協調を動的なゲームとして定式化します。このゲームでは、ロボットの動作は、他のロボットの動作にも依存する独自のダイナミクスと目的によって決まります。
順問題では、D3G は分散射撃ベースのナッシュ ソルバーを開発することにより、すべてのロボットが協力してゲームのナッシュ均衡を分散方法で求めることを可能にします。
各ロボットが特定の調整デモンストレーションを模倣するためにその目的 (およびダイナミクス) パラメーターを見つける (学習する) ことを目的とする逆問題では、D3G は、微分ポントリャーギンの最大原理に基づく微分ソルバーを提案します。これにより、各ロボットは分散型でパラメーターを更新できます。
そして調整された方法。
異なるタスク構成を与えた 2 種類のロボットを使用して、シミュレーションで D3G をテストします。
この結果は、既存の手法と比較して、順問題と逆問題の両方を解決するための D3G の有効性を示しています。

要約(オリジナル)

This paper develops a Distributed Differentiable Dynamic Game (D3G) framework, which can efficiently solve the forward and inverse problems in multi-robot coordination. We formulate multi-robot coordination as a dynamic game, where the behavior of a robot is dictated by its own dynamics and objective that also depends on others’ behavior. In the forward problem, D3G enables all robots collaboratively to seek the Nash equilibrium of the game in a distributed manner, by developing a distributed shooting-based Nash solver. In the inverse problem, where each robot aims to find (learn) its objective (and dynamics) parameters to mimic given coordination demonstrations, D3G proposes a differentiation solver based on Differential Pontryagin’s Maximum Principle, which allows each robot to update its parameters in a distributed and coordinated manner. We test the D3G in simulation with two types of robots given different task configurations. The results demonstrate the effectiveness of D3G for solving both forward and inverse problems in comparison with existing methods.

arxiv情報

著者 Xuan Wang,Yizhi Zhou,Wanxin Jin
発行日 2023-11-27 23:13:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.MA, cs.RO, cs.SY, eess.SY パーマリンク