要約
最適なロボットアセンブリ計画の問題は、制約の選択を満たしながら、指数関数的に膨大な数の可能な計画の中で最適なソリューションを見つける必要があるため、困難です。
従来、ロボットアセンブリの計画の問題はヒューリスティックを使用して解決されてきましたが、これらの方法は、特定の客観的構造または問題パラメーターのセットに固有です。
この論文では、アセンブリシーケンスを連続的な意思決定の問題として提起するロボットアセンブリ計画への新しいアプローチを提案し、最先端をはるかに上回る方法を活用することができます。
問題をマルコフ決定プロセス(MDP)として策定し、動的プログラミング(DP)を利用して、中程度のサイズの狭窄に最適なアセンブリポリシーを見つけます。
さらに、フレームワークを拡張して、アセンブリ計画の決定論的性質を活用し、最適なグラフ探査アセンブリプランナー(GEAP)のクラスを導入します。
より大きな構造については、強化学習(RL)により、高い報酬アセンブリシーケンスを生成するポリシーを学習する方法を示します。
ハッブル宇宙望遠鏡の組み立て、国際宇宙ステーション、ジェームズウェッブ宇宙望遠鏡など、さまざまなロボットアセンブリの問題に関するアプローチを評価します。
さらに、DP、GEAP、およびRLの実装が、さまざまな目的関数の下で最適なソリューションを見つけることができる方法と、定式化により優先順位の制約を分岐剪定に変換し、パフォーマンスをさらに向上させる方法を紹介します。
https://github.com/labicon/orasp-codeでコードを公開しました。
要約(オリジナル)
The optimal robot assembly planning problem is challenging due to the necessity of finding the optimal solution amongst an exponentially vast number of possible plans, all while satisfying a selection of constraints. Traditionally, robotic assembly planning problems have been solved using heuristics, but these methods are specific to a given objective structure or set of problem parameters. In this paper, we propose a novel approach to robotic assembly planning that poses assembly sequencing as a sequential decision making problem, enabling us to harness methods that far outperform the state-of-the-art. We formulate the problem as a Markov Decision Process (MDP) and utilize Dynamic Programming (DP) to find optimal assembly policies for moderately sized strictures. We further expand our framework to exploit the deterministic nature of assembly planning and introduce a class of optimal Graph Exploration Assembly Planners (GEAPs). For larger structures, we show how Reinforcement Learning (RL) enables us to learn policies that generate high reward assembly sequences. We evaluate our approach on a variety of robotic assembly problems, such as the assembly of the Hubble Space Telescope, the International Space Station, and the James Webb Space Telescope. We further showcase how our DP, GEAP, and RL implementations are capable of finding optimal solutions under a variety of different objective functions and how our formulation allows us to translate precedence constraints to branch pruning and thus further improve performance. We have published our code at https://github.com/labicon/ORASP-Code.
arxiv情報
著者 | Kartik Nagpal,Negar Mehr |
発行日 | 2025-02-24 07:23:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google