要約
この論文では、分散微分可能動的ゲーム (D3G) フレームワークを開発します。これにより、デモからマルチロボット協調を学習できます。
マルチロボットの調整を動的なゲームとして表現します。このゲームでは、ロボットの動作は、他のロボットの動作にも依存する独自のダイナミクスと目的によって決定されます。
したがって、調整は、各ロボットの目的とダイナミクスを調整することによって適応させることができます。
提案された D3G により、各ロボットは、その軌道とデモンストレーションの間の不一致を最小限に抑えることにより、分散された方法で個々のダイナミクスと目的を自動的に調整できます。
この学習フレームワークは、すべてのロボットが協力してゲームのナッシュ均衡を求めるフォワード パスと、コミュニケーション グラフを介して勾配が伝播されるバックワード パスを含む新しい設計を特徴としています。
異なるタスク構成が与えられた 2 種類のロボットを使用して、シミュレーションで D3G をテストします。
結果は、デモンストレーションからマルチロボット協調を学習するための D3G の機能を検証します。
要約(オリジナル)
This paper develops a Distributed Differentiable Dynamic Game (D3G) framework, which enables learning multi-robot coordination from demonstrations. We represent multi-robot coordination as a dynamic game, where the behavior of a robot is dictated by its own dynamics and objective that also depends on others’ behavior. The coordination thus can be adapted by tuning the objective and dynamics of each robot. The proposed D3G enables each robot to automatically tune its individual dynamics and objectives in a distributed manner by minimizing the mismatch between its trajectory and demonstrations. This learning framework features a new design, including a forward-pass, where all robots collaboratively seek Nash equilibrium of a game, and a backward-pass, where gradients are propagated via the communication graph. We test the D3G in simulation with two types of robots given different task configurations. The results validate the capability of D3G for learning multi-robot coordination from demonstrations.
arxiv情報
著者 | Xuan Wang,Yizhi Zhou,Wanxin Jin |
発行日 | 2023-03-20 22:04:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google