Counterfactual Fairness Filter for Fair-Delay Multi-Robot Navigation

要約

マルチロボットナビゲーションは、ロボットエージェントのチームが衝突することなくできるだけ早く目的地に到達するための軌道を見つけるタスクです。
この研究では、公平遅延マルチロボット ナビゲーションという新しい問題を導入します。これは、そのような効率的で安全な移動を可能にするだけでなく、可能な最良の軌道と比較した実際の軌道に関してエージェント間の移動遅延を均等化することも目的としています。

この目的を達成するためのナビゲーション ポリシーを学習するには、連続的なアクション スペースを持つロボット エージェントに関する重要な単位割り当て問題を解決する必要があります。
そこで、Navigation with Counterfactual Fairness Filter (NCF2) と呼ばれる新しいアルゴリズムを開発しました。
NCF2 では、各エージェントは、自分が目標に向かって前進できるか、それとも他のエージェントを行かせるために静止すべきかについて、反事実的な推論を実行します。
そうすることで、前述のクレジット割り当ての問題に効果的に対処し、高い効率と安全性を維持しながら旅行の遅延に関する公平性を向上させることができます。
いくつかの困難なマルチロボット ナビゲーション環境における私たちの広範な実験結果は、最先端の公平性を意識したマルチエージェント強化学習手法と比較して、NCF2 の有効性が高いことを実証しています。
デモビデオとコードはプロジェクト Web ページで入手できます: https://omron-sonicx.github.io/ncf2/

要約(オリジナル)

Multi-robot navigation is the task of finding trajectories for a team of robotic agents to reach their destinations as quickly as possible without collisions. In this work, we introduce a new problem: fair-delay multi-robot navigation, which aims not only to enable such efficient, safe travels but also to equalize the travel delays among agents in terms of actual trajectories as compared to the best possible trajectories. The learning of a navigation policy to achieve this objective requires resolving a nontrivial credit assignment problem with robotic agents having continuous action spaces. Hence, we developed a new algorithm called Navigation with Counterfactual Fairness Filter (NCF2). With NCF2, each agent performs counterfactual inference on whether it can advance toward its goal or should stay still to let other agents go. Doing so allows us to effectively address the aforementioned credit assignment problem and improve fairness regarding travel delays while maintaining high efficiency and safety. Our extensive experimental results in several challenging multi-robot navigation environments demonstrate the greater effectiveness of NCF2 as compared to state-of-the-art fairness-aware multi-agent reinforcement learning methods. Our demo videos and code are available on the project webpage: https://omron-sinicx.github.io/ncf2/

arxiv情報

著者 Hikaru Asano,Ryo Yonetani,Mai Nishimura,Tadashi Kozuno
発行日 2023-05-19 06:35:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.MA, cs.RO パーマリンク