Modular Neural Network Policies for Learning In-Flight Object Catching with a Robot Hand-Arm System

要約

ロボットのハンドアーム システムが飛行物体を捕捉する方法を学習できるように設計されたモジュール式フレームワークを紹介します。このタスクには、迅速で反応性が高く、正確なタイミングでのロボットの動作が必要です。
私たちのフレームワークは 5 つのコア モジュールで構成されています: (i) オブジェクトの軌道予測を学習するオブジェクト状態推定器、(ii) キャッチするオブジェクトのポーズをスコアリングしてランク付けすることを学習するキャッチ ポーズ品質ネットワーク、(iii) 移動するように訓練された到達制御ポリシー
事前キャッチポーズを行うロボットハンド、(iv) 安全で堅牢な掴みのためにソフトなキャッチ動作を実行するように訓練された掴み制御ポリシー、および (v) 到達および掴みポリシーによって与えられるアクションを合成するように訓練されたゲートネットワーク。
前の 2 つのモジュールは教師あり学習を通じてトレーニングされ、後の 3 つはシミュレートされた環境で深層強化学習を使用します。
当社では、各モジュールと統合システムのシミュレーションでフレームワークの広範な評価を実施し、飛行中のキャッチの高い成功率と摂動や感覚ノイズに対する堅牢性を実証しています。
単純な円筒形および球形の物体のみがトレーニングに使用されますが、統合システムは、トレーニングでは使用されないさまざまな家庭用物体への一般化に成功しています。

要約(オリジナル)

We present a modular framework designed to enable a robot hand-arm system to learn how to catch flying objects, a task that requires fast, reactive, and accurately-timed robot motions. Our framework consists of five core modules: (i) an object state estimator that learns object trajectory prediction, (ii) a catching pose quality network that learns to score and rank object poses for catching, (iii) a reaching control policy trained to move the robot hand to pre-catch poses, (iv) a grasping control policy trained to perform soft catching motions for safe and robust grasping, and (v) a gating network trained to synthesize the actions given by the reaching and grasping policy. The former two modules are trained via supervised learning and the latter three use deep reinforcement learning in a simulated environment. We conduct extensive evaluations of our framework in simulation for each module and the integrated system, to demonstrate high success rates of in-flight catching and robustness to perturbations and sensory noise. Whilst only simple cylindrical and spherical objects are used for training, the integrated system shows successful generalization to a variety of household objects that are not used in training.

arxiv情報

著者 Wenbin Hu,Fernando Acero,Eleftherios Triantafyllidis,Zhaocheng Liu,Zhibin Li
発行日 2023-12-21 16:20:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク