Physics-Aware Robotic Palletization with Online Masking Inference

要約

特にアイテムの到着のシーケンスが予測不可能なオンライン設定では、積み重ねボックスの効率的な計画は、現代の倉庫と物流管理における重要な課題のままです。
既存のソリューションは、多くの場合、ボックスサイズのバリエーションに対処しますが、実際のアプリケーションにとって重要な密度や剛性など、本質的および物理的特性を見落としています。
アクションスペースマスキングを使用して有効なアクションにRLポリシーを指示することにより、RENFERTION LEANIS(RL)を使用してこの問題を解決します。
物理的なシナリオで評価が困難なヒューリスティックな安定性評価に依存する以前の方法とは異なり、私たちのフレームワークはオンライン学習を利用してアクションスペースマスクを動的にトレーニングし、手動ヒューリスティックデザインの必要性を排除します。
広範な実験は、提案された方法が既存の最先端を上回ることを示しています。
さらに、学んだタスクプランナーを実際のロボットパレタイザーに展開し、運用設定での実際的な適用性を検証します。

要約(オリジナル)

The efficient planning of stacking boxes, especially in the online setting where the sequence of item arrivals is unpredictable, remains a critical challenge in modern warehouse and logistics management. Existing solutions often address box size variations, but overlook their intrinsic and physical properties, such as density and rigidity, which are crucial for real-world applications. We use reinforcement learning (RL) to solve this problem by employing action space masking to direct the RL policy toward valid actions. Unlike previous methods that rely on heuristic stability assessments which are difficult to assess in physical scenarios, our framework utilizes online learning to dynamically train the action space mask, eliminating the need for manual heuristic design. Extensive experiments demonstrate that our proposed method outperforms existing state-of-the-arts. Furthermore, we deploy our learned task planner in a real-world robotic palletizer, validating its practical applicability in operational settings.

arxiv情報

著者 Tianqi Zhang,Zheng Wu,Yuxin Chen,Yixiao Wang,Boyuan Liang,Scott Moura,Masayoshi Tomizuka,Mingyu Ding,Wei Zhan
発行日 2025-02-19 05:39:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク