Feasibility-aware Imitation Learning from Observations through a Hand-mounted Demonstration Interface

要約

デモンストレーションインターフェイスを介した模倣学習は、直感的な人間のデモンストレーションからロボットオートメーションのポリシーを学ぶことが期待されています。
ただし、人間とロボットの動きの特性の違いにより、人間の専門家は意図せずにロボットが実行できないアクションを実証する可能性があります。
観察(FABCO)からクローニングする実現可能性を意識する動作を提案します。
FABCOフレームワークでは、各デモンストレーションの実現可能性は、ロボットの事前に訓練された前方ダイナミクスモデルを使用して評価されます。
この実現可能性情報は、デモ参加者への視覚的なフィードバックとして提供され、デモンストレーションを改良するように促します。
政策学習中、推定された実現可能性はデモデータの重みとして機能し、学習ポリシーのデータ効率と堅牢性の両方を改善します。
Fabcoの有効性を実験的に検証し、ピペットとバイアルを含むピペット挿入タスクに適用しました。
4人の参加者が、FABCOにおける実現可能性フィードバックと加重ポリシー学習の影響を評価しました。
さらに、NASAタスクロードインデックス(NASA-TLX)を使用して、視覚的なフィードバックを使用してデモンストレーションによって誘導されるワークロードを評価しました。

要約(オリジナル)

Imitation learning through a demonstration interface is expected to learn policies for robot automation from intuitive human demonstrations. However, due to the differences in human and robot movement characteristics, a human expert might unintentionally demonstrate an action that the robot cannot execute. We propose feasibility-aware behavior cloning from observation (FABCO). In the FABCO framework, the feasibility of each demonstration is assessed using the robot’s pre-trained forward and inverse dynamics models. This feasibility information is provided as visual feedback to the demonstrators, encouraging them to refine their demonstrations. During policy learning, estimated feasibility serves as a weight for the demonstration data, improving both the data efficiency and the robustness of the learned policy. We experimentally validated FABCO’s effectiveness by applying it to a pipette insertion task involving a pipette and a vial. Four participants assessed the impact of the feasibility feedback and the weighted policy learning in FABCO. Additionally, we used the NASA Task Load Index (NASA-TLX) to evaluate the workload induced by demonstrations with visual feedback.

arxiv情報

著者 Kei Takahashi,Hikaru Sasaki,Takamitsu Matsubara
発行日 2025-03-12 03:14:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク