Safe Self-Supervised Learning in Real of Visuo-Tactile Feedback Policies for Industrial Insertion

要約

産業用挿入作業は、公差が厳しく破損しやすい部品で繰り返し実行されることがよくあります。
部品と環境の間の衝突が部品の滑りや破損を引き起こす可能性があるため、産業用挿入ポリシーを実際に学習することは困難です。
この論文では、ポーズのバリエーションを把握するために堅牢な視覚触覚挿入ポリシーを学習するための安全な自己教師あり方法を提示します。
この方法により、パーツとレセプタクル間の人間の入力と衝突が減少します。
メソッドは、挿入タスクを 2 つのフェーズに分割します。
最初の位置合わせフェーズでは、触覚ベースの把持姿勢推定モデルを学習して、挿入部分をレセプタクルに位置合わせします。
2 番目の挿入フェーズでは、パーツをレセプタクルにガイドするためのビジョンベースのポリシーが学習されます。
ロボットは力-トルク センシングを使用して、安全な自己監視型データ収集パイプラインを実現します。
NIST アセンブリ タスクボードからの USB 挿入タスクに関する物理実験は、結果として得られるポリシーが 45 の異なる初期把持ポーズで 45/45 の挿入成功を達成できることを示唆しており、2 つのベースラインを改善しています: (1) 50 人の人間の挿入デモンストレーションでトレーニングされた動作クローニング エージェント (
1/45) および (2) 実際にトレーニングされたオンライン RL ポリシー (TD3) (0/45)。

要約(オリジナル)

Industrial insertion tasks are often performed repetitively with parts that are subject to tight tolerances and prone to breakage. Learning an industrial insertion policy in real is challenging as the collision between the parts and the environment can cause slippage or breakage of the part. In this paper, we present a safe self-supervised method to learn a visuo-tactile insertion policy that is robust to grasp pose variations. The method reduces human input and collisions between the part and the receptacle. The method divides the insertion task into two phases. In the first align phase, a tactile-based grasp pose estimation model is learned to align the insertion part with the receptacle. In the second insert phase, a vision-based policy is learned to guide the part into the receptacle. The robot uses force-torque sensing to achieve a safe self-supervised data collection pipeline. Physical experiments on the USB insertion task from the NIST Assembly Taskboard suggest that the resulting policies can achieve 45/45 insertion successes on 45 different initial grasp poses, improving on two baselines: (1) a behavior cloning agent trained on 50 human insertion demonstrations (1/45) and (2) an online RL policy (TD3) trained in real (0/45).

arxiv情報

著者 Letian Fu,Huang Huang,Lars Berscheid,Hui Li,Ken Goldberg,Sachin Chitta
発行日 2023-03-21 06:38:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク