Physics-Aware Combinatorial Assembly Planning using Deep Reinforcement Learning


組み合わせアセンブリでは、標準化されたユニット プリミティブを使用して、ユーザーの仕様を満たすオブジェクトを構築します。
レゴは、ユニット プリミティブ (つまり、レゴ ブロック) を使用して高度にカスタマイズ可能な 3D オブジェクトを構築する、組み合わせアセンブリに広く使用されているプラ​​ットフォームです。
目的のオブジェクトの形状を考慮して、レゴ ブロックを配置してターゲット オブジェクトを構築するための一連のアクションを見つけたいと思います。
特に、計画されたアセンブリ シーケンスが物理的に実行可能であることを保証することを目指しています。
ただし、組み合わせアセンブリのアセンブリ シーケンス プランニング (ASP) は、その組み合わせの性質、つまり膨大な数の可能な組み合わせと複雑な制約により、特に困難です。
この課題に対処するために、深層強化学習を使用して、ユニット プリミティブを順番に配置して目的のオブジェクトを構築するための構築ポリシーを学習します。
具体的には、無効なアクションを効率的に除外し、ポリシー学習をガイドするオンラインの物理認識アクション マスクを設計します。


Combinatorial assembly uses standardized unit primitives to build objects that satisfy user specifications. Lego is a widely used platform for combinatorial assembly, in which people use unit primitives (ie Lego bricks) to build highly customizable 3D objects. This paper studies sequence planning for physical combinatorial assembly using Lego. Given the shape of the desired object, we want to find a sequence of actions for placing Lego bricks to build the target object. In particular, we aim to ensure the planned assembly sequence is physically executable. However, assembly sequence planning (ASP) for combinatorial assembly is particularly challenging due to its combinatorial nature, ie the vast number of possible combinations and complex constraints. To address the challenges, we employ deep reinforcement learning to learn a construction policy for placing unit primitives sequentially to build the desired object. Specifically, we design an online physics-aware action mask that efficiently filters out invalid actions and guides policy learning. In the end, we demonstrate that the proposed method successfully plans physically valid assembly sequences for constructing different Lego structures. The generated construction plan can be executed in real.


著者 Ruixuan Liu,Alan Chen,Weiye Zhao,Changliu Liu
発行日 2024-08-19 17:16:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, cs.RO パーマリンク