EasyInsert: A Data-Efficient and Generalizable Insertion Policy

要約

挿入タスクは非常に挑戦的であり、散らかった環境ではロボットが並外れた精度で動作する必要があります。
既存の方法は、多くの場合、一般化能力が不十分です。
それらは通常、制限された構造化された環境で機能し、プラグとソケットが遠く離れている場合、シーンが密集している場合、または新しいオブジェクトを処理するときに頻繁に故障します。
また、CADモデルへのアクセスやシミュレーションのデジタルツインなどの強力な仮定にも依存しています。
これに対処するために、easeedInterertを提案します。これは、プラグとソケットの間で相対的なポーズ(デルタポーズ)が挿入を成功させるのに十分であり、相対的なポーズ予測の一般化可能なモデルを訓練するために最小限の人間の労働を伴う効率的で自動化された現実世界のデータ収集を採用するという人間の直観を活用するフレームワークを提案します。
実行中、EasyInSertは、予測されたデルタポーズに基づいて粗からファインまでの実行手順に従い、さまざまな挿入タスクを正常に実行します。
EasyInSertは、散らかった環境で目に見えないオブジェクトの強力なゼロショット一般化能力を示し、高いサンプル効率を維持し、人間の努力をほとんど必要としながら、重要な初期ポーズ逸脱のケースを処理します。
たった5時間のトレーニングデータを使用した実際の実験では、EasyInSertは、タイプCケーブル、HDMIケーブル、イーサネットケーブルなどの挑戦的なオブジェクトを含む15の目に見えない新しいオブジェクトの13のゼロショット挿入で90%以上の成功を達成します。
さらに、微調整のために1つの人間のデモと4分間の自動収集データのみで、15のオブジェクトすべてで90%以上の成功率に達します。

要約(オリジナル)

Insertion task is highly challenging that requires robots to operate with exceptional precision in cluttered environments. Existing methods often have poor generalization capabilities. They typically function in restricted and structured environments, and frequently fail when the plug and socket are far apart, when the scene is densely cluttered, or when handling novel objects. They also rely on strong assumptions such as access to CAD models or a digital twin in simulation. To address this, we propose EasyInsert, a framework which leverages the human intuition that relative pose (delta pose) between plug and socket is sufficient for successful insertion, and employs efficient and automated real-world data collection with minimal human labor to train a generalizable model for relative pose prediction. During execution, EasyInsert follows a coarse-to-fine execution procedure based on predicted delta pose, and successfully performs various insertion tasks. EasyInsert demonstrates strong zero-shot generalization capability for unseen objects in cluttered environments, handling cases with significant initial pose deviations while maintaining high sample efficiency and requiring little human effort. In real-world experiments, with just 5 hours of training data, EasyInsert achieves over 90% success in zero-shot insertion for 13 out of 15 unseen novel objects, including challenging objects like Type-C cables, HDMI cables, and Ethernet cables. Furthermore, with only one human demonstration and 4 minutes of automatically collected data for fine-tuning, it reaches over 90% success rate for all 15 objects.

arxiv情報

著者 Guanghe Li,Junming Zhao,Shengjie Wang,Yang Gao
発行日 2025-05-22 03:46:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク