Hierarchical Policy Blending as Inference for Reactive Robot Control

要約

乱雑で密集した動的な環境でのモーション生成は、ロボット工学の中心的なトピックであり、多目的の意思決定問題として表現されます。
現在のアプローチは、安全性とパフォーマンスの間のトレードオフです。
一方で、事後対応型の政策は、最適ではない行動を起こすリスクを伴いながら、環境変化への迅速な対応を保証します。
一方、計画ベースのモーション生成では実現可能な軌道が得られますが、計算コストが高いため制御頻度が制限され、安全性が制限される可能性があります。
リアクティブなポリシーと計画の利点を組み合わせるために、階層的なモーション生成方法を提案します。
さらに、確率的推論手法を採用して階層モデルと確率的最適化を形式化します。
私たちはこのアプローチを、確率的で反応的なエキスパート ポリシーの重み付けされた製品として実現しており、計画を使用してタスク範囲全体にわたって最適な重みを適応的に計算します。
この確率的最適化は、局所的な最適化を回避し、乱雑で密集した環境でパスを見つける実行可能な事後対応型の計画を提案します。
平面ナビゲーションと 6DoF 操作に関する広範な実験研究により、提案した階層運動生成方法が近視反応性コントローラーとオンライン再計画方法の両方よりも優れていることが示されています。

要約(オリジナル)

Motion generation in cluttered, dense, and dynamic environments is a central topic in robotics, rendered as a multi-objective decision-making problem. Current approaches trade-off between safety and performance. On the one hand, reactive policies guarantee fast response to environmental changes at the risk of suboptimal behavior. On the other hand, planning-based motion generation provides feasible trajectories, but the high computational cost may limit the control frequency and thus safety. To combine the benefits of reactive policies and planning, we propose a hierarchical motion generation method. Moreover, we adopt probabilistic inference methods to formalize the hierarchical model and stochastic optimization. We realize this approach as a weighted product of stochastic, reactive expert policies, where planning is used to adaptively compute the optimal weights over the task horizon. This stochastic optimization avoids local optima and proposes feasible reactive plans that find paths in cluttered and dense environments. Our extensive experimental study in planar navigation and 6DoF manipulation shows that our proposed hierarchical motion generation method outperforms both myopic reactive controllers and online re-planning methods.

arxiv情報

著者 Kay Hansel,Julen Urain,Jan Peters,Georgia Chalvatzaki
発行日 2023-05-31 12:39:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク