Hierarchical Policy Blending As Optimal Transport

要約

タイトル – ヒエラルキカルポリシーブレンディングとしての最適輸送
要約 – HiPBOTは、パラメータ空間に先読み計画レイヤーを追加することで、異なるエージェントの低レベル反応型専門家のポリシーの重みを階層的に調整する。高レベルプランナーがポリシーブレンディングを不均衡な最適輸送として表現するため、HiPBOTは測地線運動ポリシーのスケーリングを統合して、エキスパートポリシーとエージェントの優先順位を効果的に決定し、タスクの成功と安全性を確保する。低次元のナビゲーションから高次元の全身制御まで、複数のアプリケーションシナリオでの実験結果は、HiPBOTの有効性と効率性を示している。確率的推論を採用するか、専門家のツリー構造を定義するかどうかに関係なく、当社の方法は最先端のベースラインを上回り、最適輸送をロボット制御に応用する新しいアプリケーションの道を開拓する。詳細はhttps://sites.google.com/view/hipobotにあります。

– HiPBOTは、エージェントの低レベル専門家ポリシーの重みを階層的に調整することで、エキスパートポリシーとエージェントの優先順位を効果的に決定し、タスクの成功と安全性を確保する。
– HiPBOTは、先読み計画レイヤーをパラメータ空間に追加することでポリシーブレンディングを不均衡な最適輸送として表現し、異なるエージェントの反応型専門家ポリシーのスケーリングを統合する。
– HiPBOTは、低次元のナビゲーションから高次元の全身制御まで、複数のアプリケーションシナリオで有効性と効率性を示している。
– HiPBOTの方法は、確率的推論を採用するか、専門家のツリー構造を定義するかどうかに関係なく、最先端のベースラインを上回り、最適輸送をロボット制御に応用する新しいアプリケーションの道を開拓する。

要約(オリジナル)

We present hierarchical policy blending as optimal transport (HiPBOT). HiPBOT hierarchically adjusts the weights of low-level reactive expert policies of different agents by adding a look-ahead planning layer on the parameter space. The high-level planner renders policy blending as unbalanced optimal transport consolidating the scaling of the underlying Riemannian motion policies. As a result, HiPBOT effectively decides the priorities between expert policies and agents, ensuring the task’s success and guaranteeing safety. Experimental results in several application scenarios, from low-dimensional navigation to high-dimensional whole-body control, show the efficacy and efficiency of HiPBOT. Our method outperforms state-of-the-art baselines — either adopting probabilistic inference or defining a tree structure of experts — paving the way for new applications of optimal transport to robot control. More material at https://sites.google.com/view/hipobot

arxiv情報

著者 An T. Le,Kay Hansel,Jan Peters,Georgia Chalvatzaki
発行日 2023-04-12 09:57:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY パーマリンク