HERB: Human-augmented Efficient Reinforcement learning for Bin-packing

要約

オブジェクトを効率的に梱包することは、ロジスティクス、倉庫の自動化、ロボット工学の根本的な問題です。
従来の梱包ソリューションは幾何学的最適化に焦点を当てていますが、不規則な梱包では、3Dオブジェクトは、形状と安定性の変動により、重大な課題を提示します。
強化学習〜(RL)は、ロボットパッキングタスクで人気を博していますが、純粋にシミュレーションからのトレーニングは非効率的で計算上の高価です。
この作業では、不規則なオブジェクトを梱包するための人間が熟成したRLフレームワークであるハーブを提案します。
まず、人間のデモンストレーションを活用して、梱包するオブジェクトの最良のシーケンスを学習します。これは、明示的にモデル化するのが難しいスペースの最適化、安定性、オブジェクト関係などの潜在的な要因を組み込みます。
次に、視覚情報を使用して梱包容器内の最適なオブジェクトの位置を決定する配置アルゴリズムをトレーニングします。
私たちのアプローチは、広範なパフォーマンス評価を通じて検証され、梱包効率と遅延の両方を分析します。
最後に、ロボットシステムでの方法の実際の実現可能性を実証します。
実験結果は、私たちの方法が、人間の直感を活用し、梱包の堅牢性と適応性の両方を改善することにより、幾何学的および純粋にRLベースのアプローチよりも優れていることを示しています。
この作業は、人間の専門知識主導のRLを組み合わせて、ロボットシステムにおける複雑な現実世界の梱包の課題に取り組む可能性を強調しています。

要約(オリジナル)

Packing objects efficiently is a fundamental problem in logistics, warehouse automation, and robotics. While traditional packing solutions focus on geometric optimization, packing irregular, 3D objects presents significant challenges due to variations in shape and stability. Reinforcement Learning~(RL) has gained popularity in robotic packing tasks, but training purely from simulation can be inefficient and computationally expensive. In this work, we propose HERB, a human-augmented RL framework for packing irregular objects. We first leverage human demonstrations to learn the best sequence of objects to pack, incorporating latent factors such as space optimization, stability, and object relationships that are difficult to model explicitly. Next, we train a placement algorithm that uses visual information to determine the optimal object positioning inside a packing container. Our approach is validated through extensive performance evaluations, analyzing both packing efficiency and latency. Finally, we demonstrate the real-world feasibility of our method on a robotic system. Experimental results show that our method outperforms geometric and purely RL-based approaches by leveraging human intuition, improving both packing robustness and adaptability. This work highlights the potential of combining human expertise-driven RL to tackle complex real-world packing challenges in robotic systems.

arxiv情報

著者 Gojko Perovic,Nuno Ferreira Duarte,Atabak Dehban,Gonçalo Teixeira,Egidio Falotico,José Santos-Victor
発行日 2025-04-23 10:24:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク