Robotic Object Insertion with a Soft Wrist through Sim-to-Real Privileged Training

要約

この研究は、柔らかい手首を備えたロボットを使用して、非構造化環境下での接触が多い物体挿入タスクに取り組み、安全な接触インタラクションを可能にします。
非構造化環境の場合、物体の把握と穴のポーズには不確実性があり、柔らかい手首のポーズは直接測定できないと仮定します。
最近の方法では、学習アプローチと力/トルク センサーを使用して接触位置を特定しています。
ただし、現実世界でのデータ収集が必要です。
この研究では、特権トレーニング戦略を使用したシミュレーションからリアルへのアプローチを提案しています。
この方法には 2 つのステップがあります。
1) 教師ポリシーは、センサー入力とペグ ポーズなどのグラウンド トゥルース特権情報を使用してタスクを完了するようにトレーニングされ、次に 2) 生徒エンコーダーは教師ポリシー ロールアウトから生成されたデータを使用してトレーニングされ、センサー履歴から特権情報を推定します。
把握とホールポーズの不確実性の下で、シミュレーションと現実の実験を実行しました。
この結果、円形ペグ挿入の成功率はそれぞれ 0、+5、-5 度で 100\%、95\%、80\% となり、開始位置はデフォルトから $\pm$ 10 mm ランダムにシフトされました。
位置。
また、訓練中には見ら​​れなかった四角いペグを使用して、提案された方法をテストしました。
追加のシミュレーション評価により、特権戦略を使用すると、シミュレートされたセンサー データのみを使用したトレーニングと比較して成功率が向上することが明らかになりました。
私たちの結果は、ソフト ロボットに sim-to-real 特権トレーニングを使用する利点を示しており、これによりロボットの組み立てにおける人間工学の労力が軽減される可能性があります。

要約(オリジナル)

This study addresses contact-rich object insertion tasks under unstructured environments using a robot with a soft wrist, enabling safe contact interactions. For the unstructured environments, we assume that there are uncertainties in object grasp and hole pose and that the soft wrist pose cannot be directly measured. Recent methods employ learning approaches and force/torque sensors for contact localization; however, they require data collection in the real world. This study proposes a sim-to-real approach using a privileged training strategy. This method has two steps. 1) The teacher policy is trained to complete the task with sensor inputs and ground truth privileged information such as the peg pose, and then 2) the student encoder is trained with data produced from teacher policy rollouts to estimate the privileged information from sensor history. We performed sim-to-real experiments under grasp and hole pose uncertainties. This resulted in 100\%, 95\%, and 80\% success rates for circular peg insertion with 0, +5, and -5 degree peg misalignments, respectively, and start positions randomly shifted $\pm$ 10 mm from a default position. Also, we tested the proposed method with a square peg that was never seen during training. Additional simulation evaluations revealed that using the privileged strategy improved success rates compared to training with only simulated sensor data. Our results demonstrate the advantage of using sim-to-real privileged training for soft robots, which has the potential to alleviate human engineering efforts for robotic assembly.

arxiv情報

著者 Yuni Fuchioka,Cristian C. Beltran-Hernandez,Hai Nguyen,Masashi Hamaya
発行日 2024-08-30 07:47:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク