要約
モバイルマニピュレーターを使用して、可動障害物(NAMO)の効率的なナビゲーションのための階層補強学習(HRL)フレームワークを提案します。
私たちのアプローチは、相互作用ベースの障害物特性の推定と構造化されたプッシュ戦略を組み合わせており、事前に計画されたグローバルパスを順守しながら、予期せぬ障害の動的操作を促進します。
高レベルのポリシーは、環境の制約とパス追跡目標を考慮するプッシュコマンドを生成し、低レベルのポリシーは、調整された全身運動を通じてこれらのコマンドを正確かつ安定に実行します。
包括的なシミュレーションベースの実験は、ベースラインと比較して、より高い成功率、経路の長さの短縮、目標測定時間の短縮など、NAMOタスクの実行の改善を示しています。
さらに、アブレーション研究は各コンポーネントの有効性を評価しますが、定性分析では、リアルタイムの障害物特性推定の精度と信頼性をさらに検証します。
要約(オリジナル)
We propose a hierarchical reinforcement learning (HRL) framework for efficient Navigation Among Movable Obstacles (NAMO) using a mobile manipulator. Our approach combines interaction-based obstacle property estimation with structured pushing strategies, facilitating the dynamic manipulation of unforeseen obstacles while adhering to a pre-planned global path. The high-level policy generates pushing commands that consider environmental constraints and path-tracking objectives, while the low-level policy precisely and stably executes these commands through coordinated whole-body movements. Comprehensive simulation-based experiments demonstrate improvements in performing NAMO tasks, including higher success rates, shortened traversed path length, and reduced goal-reaching times, compared to baselines. Additionally, ablation studies assess the efficacy of each component, while a qualitative analysis further validates the accuracy and reliability of the real-time obstacle property estimation.
arxiv情報
著者 | Taegeun Yang,Jiwoo Hwang,Jeil Jeong,Minsung Yoon,Sung-Eui Yoon |
発行日 | 2025-06-18 11:49:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google