要約
この研究は、デカルト ロボットの現実的な産業シナリオから抽象化された双腕オブジェクトの再配置問題に焦点を当てています。
この問題の目標は、最小の合計完了時間ですべてのオブジェクトをソースからターゲットに転送することです。
目標を達成するための中心となるアイデアは、累積タスク実行時間を最小限に抑え、デュアルアームの連携効率を最大化する効果的なオブジェクトからアームへのタスク割り当て戦略を開発することです。
タスクの割り当てにおける困難の 1 つは、スケーラビリティの問題です。
オブジェクトの数が増えると、従来のオフライン検索ベースの方法の計算時間は、計算の複雑さのために大幅に増加します。
長期シーケンスのタスク決定における強化学習 (RL) の適応性を利用して、RL に基づくオンライン タスク割り当て決定方法を提案します。この方法の計算時間は、オブジェクトの数に応じて線形に増加するだけです。
さらに、タスク実行プロセス全体における入力状態間の依存関係をモデル化するアテンションベースのネットワークを設計し、各タスク割り当てラウンドで最も合理的なオブジェクトとアームの対応関係を見つけるのに役立ちます。
実験部分では、いくつかの検索ベースの方法をこの特定の設定に適応させ、私たちの方法をそれらと比較します。
実験結果は、私たちのアプローチが総実行時間と計算効率において検索ベースの方法よりも優れたパフォーマンスを達成することを示し、また、さまざまな数のオブジェクトに対する私たちの方法の一般化も検証します。
さらに、補足ビデオでは、実際のロボットに導入された手法の有効性を示します。
要約(オリジナル)
This work focuses on the dual-arm object rearrangement problem abstracted from a realistic industrial scenario of Cartesian robots. The goal of this problem is to transfer all the objects from sources to targets with the minimum total completion time. To achieve the goal, the core idea is to develop an effective object-to-arm task assignment strategy for minimizing the cumulative task execution time and maximizing the dual-arm cooperation efficiency. One of the difficulties in the task assignment is the scalability problem. As the number of objects increases, the computation time of traditional offline-search-based methods grows strongly for computational complexity. Encouraged by the adaptability of reinforcement learning (RL) in long-sequence task decisions, we propose an online task assignment decision method based on RL, and the computation time of our method only increases linearly with the number of objects. Further, we design an attention-based network to model the dependencies between the input states during the whole task execution process to help find the most reasonable object-to-arm correspondence in each task assignment round. In the experimental part, we adapt some search-based methods to this specific setting and compare our method with them. Experimental result shows that our approach achieves outperformance over search-based methods in total execution time and computational efficiency, and also verifies the generalization of our method to different numbers of objects. In addition, we show the effectiveness of our method deployed on the real robot in the supplementary video.
arxiv情報
著者 | Shishun Zhang,Qijin She,Wenhao Li,Chenyang Zhu,Yongjun Wang,Ruizhen Hu,Kai Xu |
発行日 | 2024-02-21 09:13:08+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google