RObotic MAnipulation Network (ROMAN) $\unicode{x2013}$ Hybrid Hierarchical Learning for Solving Complex Sequential Tasks

要約

長く続く連続タスクを解決することは、身体化された人工知能にとって大きな課題となります。
ロボット システムが幅広い操作スキルを使ってさまざまな連続タスクを実行できるようにすることは、活発な研究分野です。
この研究では、ロボット操作における複数の複雑なタスクを長期間にわたって解決するという課題に対処するために、ハイブリッド階層学習フレームワークであるロボット操作ネットワーク (ROMAN) を紹介します。
ROMAN は、行動の複製、模倣学習、強化学習を統合することで、タスクの多様性と堅牢な障害回復を実現します。
これは、さまざまなニューラル ネットワークのアンサンブルを調整する中央操作ネットワークで構成され、それぞれが個別の再結合可能なサブタスクに特化し、複雑な長期にわたる操作タスクを解決するための正しいインシーケンス アクションを生成します。
実験結果は、これらの特殊な操作エキスパートを調整して起動することにより、ROMAN が、さまざまな感覚ノイズに対する堅牢性を示しながら、高度な操作タスクの長いシーケンスを達成し、デモンストレーションを超えた適応動作を達成するための正しい連続起動を生成することを示しています。
これらの結果は、自律的な障害回復機能を備えた ROMAN の動的適応性の重要性と多用途性を実証し、適応的な運動能力を必要とするさまざまな自律的な操作タスクに対する ROMAN の可能性を強調しています。

要約(オリジナル)

Solving long sequential tasks poses a significant challenge in embodied artificial intelligence. Enabling a robotic system to perform diverse sequential tasks with a broad range of manipulation skills is an active area of research. In this work, we present a Hybrid Hierarchical Learning framework, the Robotic Manipulation Network (ROMAN), to address the challenge of solving multiple complex tasks over long time horizons in robotic manipulation. ROMAN achieves task versatility and robust failure recovery by integrating behavioural cloning, imitation learning, and reinforcement learning. It consists of a central manipulation network that coordinates an ensemble of various neural networks, each specialising in distinct re-combinable sub-tasks to generate their correct in-sequence actions for solving complex long-horizon manipulation tasks. Experimental results show that by orchestrating and activating these specialised manipulation experts, ROMAN generates correct sequential activations for accomplishing long sequences of sophisticated manipulation tasks and achieving adaptive behaviours beyond demonstrations, while exhibiting robustness to various sensory noises. These results demonstrate the significance and versatility of ROMAN’s dynamic adaptability featuring autonomous failure recovery capabilities, and highlight its potential for various autonomous manipulation tasks that demand adaptive motor skills.

arxiv情報

著者 Eleftherios Triantafyllidis,Fernando Acero,Zhaocheng Liu,Zhibin Li
発行日 2023-07-07 17:26:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク