Learning and generalization of robotic dual-arm manipulation of boxes from demonstrations via Gaussian Mixture Models (GMMs)

要約

デモンストレーション(LFD)から学ぶことは、ロボットに人間のような方法でオブジェクトを動かして操作するように教える効果的な方法です。
これは、ペイロード容量と操作性の向上に採用されているデュアルアームを持つものなど、複雑なロボットシステムを扱う場合に特に当てはまります。
ただし、重要な課題は、学習したシナリオを超えてロボットの動きを拡大して、特定のデモンストレーションからのマイナーおよび大きなバリエーションに適応することです。
この作業では、人間のデモンストレーションから派生した学習ガウス混合モデル(GMM)パラメーター化ポリシーを適応させる学習と斬新な一般化アプローチを提案します。
私たちの方法では、少数の人間のデモのみを必要とし、デモ段階でロボットシステムの必要性を排除します。これにより、コストと時間の両方を大幅に削減できます。
一般化プロセスは、パラメーター空間で直接行われ、GMMパラメーターの低次元表現を活用します。
ガウスコンポーネントごとにパラメーターが3つしかないため、このプロセスは計算効率が高く、リクエストに応じて即時の結果をもたらします。
ボックスのデュアルアームロボット操作を含む実際の実験を通じて、アプローチを検証します。
単一のタスクの5つのデモンストレーションから始めて、当社のアプローチは、新しいターゲットの場所、オリエンテーション、ボックスサイズなど、新しい目に見えないシナリオにうまく一般的になります。
これらの結果は、複雑な操作のための方法の実用的な適用性とスケーラビリティを強調しています。

要約(オリジナル)

Learning from demonstration (LfD) is an effective method to teach robots to move and manipulate objects in a human-like manner. This is especially true when dealing with complex robotic systems, such as those with dual arms employed for their improved payload capacity and manipulability. However, a key challenge is in expanding the robotic movements beyond the learned scenarios to adapt to minor and major variations from the specific demonstrations. In this work, we propose a learning and novel generalization approach that adapts the learned Gaussian Mixture Model (GMM)-parameterized policy derived from human demonstrations. Our method requires only a small number of human demonstrations and eliminates the need for a robotic system during the demonstration phase, which can significantly reduce both cost and time. The generalization process takes place directly in the parameter space, leveraging the lower-dimensional representation of GMM parameters. With only three parameters per Gaussian component, this process is computationally efficient and yields immediate results upon request. We validate our approach through real-world experiments involving a dual-arm robotic manipulation of boxes. Starting with just five demonstrations for a single task, our approach successfully generalizes to new unseen scenarios, including new target locations, orientations, and box sizes. These results highlight the practical applicability and scalability of our method for complex manipulations.

arxiv情報

著者 Qian Ying Lee,Suhas Raghavendra Kulkarni,Kenzhi Iskandar Wong,Lin Yang,Bernardo Noronha,Yongjun Wee,Tzu-Yi Hung,Domenico Campolo
発行日 2025-03-07 17:43:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク