要約
最適なロボット組立計画の問題は、制約の選択をすべて満たしながら、指数関数的に膨大な数の可能な計画の中から最適な解決策を見つける必要があるため、困難です。
従来、ロボットの組み立て計画の問題はヒューリスティックを使用して解決されてきましたが、これらの方法は特定の目的の構造または一連の問題パラメーターに固有のものです。
この論文では、ロボット組立計画への新しいアプローチを提案します。このアプローチでは、組立順序付けを逐次的な意思決定問題として提起し、最先端技術をはるかに上回る手法の活用を可能にします。
私たちは問題をマルコフ決定プロセス (MDP) として定式化し、動的計画法 (DP) を利用して中程度のサイズの狭窄に対する最適なアセンブリ ポリシーを見つけます。
私たちはフレームワークをさらに拡張して、アセンブリ計画の決定論的な性質を活用し、最適なグラフ探索アセンブリ プランナー (GEAP) のクラスを導入します。
より大きな構造については、強化学習 (RL) によって、高報酬のアセンブリシーケンスを生成するポリシーをどのように学習できるかを示します。
私たちは、ハッブル宇宙望遠鏡、国際宇宙ステーション、ジェームズ・ウェッブ宇宙望遠鏡の組み立てなど、ロボットの組み立てに関するさまざまな問題に対するアプローチを評価します。
さらに、DP、GEAP、および RL の実装がさまざまな目的関数の下で最適なソリューションを見つけることができる方法と、定式化によって優先順位制約を分岐枝刈りに変換してパフォーマンスをさらに向上させる方法を紹介します。
コードは https://github.com/labicon/ORASP-Code で公開しています。
要約(オリジナル)
The optimal robot assembly planning problem is challenging due to the necessity of finding the optimal solution amongst an exponentially vast number of possible plans, all while satisfying a selection of constraints. Traditionally, robotic assembly planning problems have been solved using heuristics, but these methods are specific to a given objective structure or set of problem parameters. In this paper, we propose a novel approach to robotic assembly planning that poses assembly sequencing as a sequential decision making problem, enabling us to harness methods that far outperform the state-of-the-art. We formulate the problem as a Markov Decision Process (MDP) and utilize Dynamic Programming (DP) to find optimal assembly policies for moderately sized strictures. We further expand our framework to exploit the deterministic nature of assembly planning and introduce a class of optimal Graph Exploration Assembly Planners (GEAPs). For larger structures, we show how Reinforcement Learning (RL) enables us to learn policies that generate high reward assembly sequences. We evaluate our approach on a variety of robotic assembly problems, such as the assembly of the Hubble Space Telescope, the International Space Station, and the James Webb Space Telescope. We further showcase how our DP, GEAP, and RL implementations are capable of finding optimal solutions under a variety of different objective functions and how our formulation allows us to translate precedence constraints to branch pruning and thus further improve performance. We have published our code at https://github.com/labicon/ORASP-Code.
arxiv情報
著者 | Kartik Nagpal,Negar Mehr |
発行日 | 2023-10-26 03:01:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google