Self-Supervised Learning For Robust Robotic Grasping In Dynamic Environment

要約

動的環境における脅威には、物体の動きの予測不可能性やロボットによる把握への干渉などがあります。
このような状況では、従来の教師あり強化学習アプローチは、大量のラベル付きデータと事前定義された報酬信号に依存するため、あまり適していません。
より具体的には、この論文では、自己教師あり学習 (SSL) として知られる重要かつ有望なフレームワークを紹介します。その目標は、RGBD センサーとロボットの手からの固有受容データに適用して、ロボットがリアルタイムで把握戦略を学習および改善できるようにすることです。

インバリアント SSL フレームワークは、オブジェクトの動作の変化に SSL システムを適応させ、動的な状況でのパフォーマンスを向上させることで、固定ラベル付けの欠点を克服します。
上記で提案された方法は、さまざまなシミュレーションと現実世界での試験を通じてテストされ、特に動的シナリオの下で、他の既存の方法よりも 15% という強化された把握成功率を獲得しました。
また、適応時間のテストにより、システムがより速く適応できることが確認され、産業オートメーションやサービスロボットなどの現実世界での使用に適用可能です。
将来の研究では、提案された方法論をより広範囲のロボットタスクに適用するために、提案されたアプローチは、複数のオブジェクトの操作や乱雑な環境のコンテキストでの機能など、より複雑なタスクに拡張される予定です。

要約(オリジナル)

Some of the threats in the dynamic environment include the unpredictability of the motion of objects and interferences to the robotic grasp. In such conditions the traditional supervised and reinforcement learning approaches are ill suited because they rely on a large amount of labelled data and a predefined reward signal. More specifically in this paper we introduce an important and promising framework known as self supervised learning (SSL) whose goal is to apply to the RGBD sensor and proprioceptive data from robot hands in order to allow robots to learn and improve their grasping strategies in real time. The invariant SSL framework overcomes the deficiencies of the fixed labelling by adapting the SSL system to changes in the objects behavior and improving performance in dynamic situations. The above proposed method was tested through various simulations and real world trials, with the series obtaining enhanced grasp success rates of 15% over other existing methods, especially under dynamic scenarios. Also, having tested for adaptation times, it was confirmed that the system could adapt faster, thus applicable for use in the real world, such as in industrial automation and service robotics. In future work, the proposed approach will be expanded to more complex tasks, such as multi object manipulation and functions in the context of cluttered environments, in order to apply the proposed methodology to a broader range of robotic tasks.

arxiv情報

著者 Ankit Shaw
発行日 2024-10-15 03:22:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク