Zero-Shot Sim-to-Real Reinforcement Learning for Fruit Harvesting

要約

このペーパーでは、フランカパンダロボットを使用した密なクラスターからの自動イチゴピッキングのための包括的なSIM-to-Realパイプラインを紹介します。
当社のアプローチは、ドメインランダム化手法を統合するカスタムMujocoシミュレーション環境を活用しています。
この環境では、休眠比最小化アルゴリズムを使用して、深い補強学習エージェントが訓練されています。
提案されたパイプラインブリッジは、高レベルの認識と意思決定を伴う低レベルの制御を行い、シミュレーションと実際の実験室環境の両方で有望なパフォーマンスを示し、現実世界の自律的な果物の収穫への転送を成功させるための基礎を築きます。

要約(オリジナル)

This paper presents a comprehensive sim-to-real pipeline for autonomous strawberry picking from dense clusters using a Franka Panda robot. Our approach leverages a custom Mujoco simulation environment that integrates domain randomization techniques. In this environment, a deep reinforcement learning agent is trained using the dormant ratio minimization algorithm. The proposed pipeline bridges low-level control with high-level perception and decision making, demonstrating promising performance in both simulation and in a real laboratory environment, laying the groundwork for successful transfer to real-world autonomous fruit harvesting.

arxiv情報

著者 Emlyn Williams,Athanasios Polydoros
発行日 2025-05-13 11:40:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク