要約
劣駆動操作問題に適用される協調操作のフレームワークを紹介します。
2 台の固定ロボット マニピュレーターは、共有作業スペース内でオブジェクトを再配置するために協力する必要があります。
操作タスクのためのマルチエージェントシステムの制御は、群れによって共通の目的を果たすエージェント間の通信がほとんどまたはまったくないため、個々の制御戦略に依存することはできません。
代わりに、サブタスクを個々のエージェントに照会する調整戦略が必要です。
タスクとモーション プランニング (TAMP) の設定で問題を定式化する一方で、タスクとモーション プランニングの問題を別々に扱うことを可能にする分解戦略を検討します。
深い強化学習技術を使用して監督計画の問題をオフラインで解決し、2 つのマニピュレーターを調整してピック アンド プレース タスクを正常に実行できる監督ポリシーを導き出します。
さらに、タスク計画の問題をオフラインで解決する利点は、サブタスクの実行に失敗した場合やオンザフライでタスクが変更された場合の堅牢性を実証する、リアルタイムの (再) 計画の可能性です。
このフレームワークは、実際のセットアップで 90% を超える成功率でゼロショット展開を達成しました。
要約(オリジナル)
We introduce a framework for cooperative manipulation, applied on an underactuated manipulation problem. Two stationary robotic manipulators are required to cooperate in order to reposition an object within their shared work space. Control of multi-agent systems for manipulation tasks cannot rely on individual control strategies with little to no communication between the agents that serve the common objective through swarming. Instead a coordination strategy is required that queries subtasks to the individual agents. We formulate the problem in a Task And Motion Planning (TAMP) setting, while considering a decomposition strategy that allows us to treat the task and motion planning problems separately. We solve the supervisory planning problem offline using deep Reinforcement Learning techniques resulting into a supervisory policy capable of coordinating the two manipulators into a successful execution of the pick-and-place task. Additionally, a benefit of solving the task planning problem offline is the possibility of real-time (re)planning, demonstrating robustness in the event of subtask execution failure or on-the-fly task changes. The framework achieved zero-shot deployment on the real setup with a success rate that is higher than 90%.
arxiv情報
著者 | Sander De Witte,Tom Lefebvre,Thijs Van Hauwermeiren,Guillaume Crevecoeur |
発行日 | 2023-02-22 16:59:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google