Synchronized Dual-arm Rearrangement via Cooperative mTSP

要約

同期デュアルアーム再配置は、産業用途における一般的なシナリオとして広く研究されています。
ロボットアームの再配置の計算の複雑さとデュアルアーム計画の高次元の性質により、スケーラビリティの課題に直面することがよくあります。
これらの課題に対処するために、私たちは、エージェントが協力コストを共有する mTSP の変形である協調 mTSP として問題を定式化し、その解決策に強化学習を利用しました。
私たちのアプローチには、空間関係を捉えたタスク状態グラフとアクション コストの詳細を提供する協力コスト マトリックスを使用して再配置タスクを表現することが含まれていました。
これらの表現を観察として捉え、それらを効果的に組み合わせて合理的なタスク スケジューリングを提供する注意ベースのネットワークを設計しました。
さらに、コスト予測機能も導入され、トレーニングと計画の両方でアクションを直接評価できるため、計画プロセスが大幅に短縮されます。
私たちの実験結果は、パフォーマンスと計画効率の両方の点で、私たちのアプローチが既存の方法よりも優れていることを示しています。

要約(オリジナル)

Synchronized dual-arm rearrangement is widely studied as a common scenario in industrial applications. It often faces scalability challenges due to the computational complexity of robotic arm rearrangement and the high-dimensional nature of dual-arm planning. To address these challenges, we formulated the problem as cooperative mTSP, a variant of mTSP where agents share cooperative costs, and utilized reinforcement learning for its solution. Our approach involved representing rearrangement tasks using a task state graph that captured spatial relationships and a cooperative cost matrix that provided details about action costs. Taking these representations as observations, we designed an attention-based network to effectively combine them and provide rational task scheduling. Furthermore, a cost predictor is also introduced to directly evaluate actions during both training and planning, significantly expediting the planning process. Our experimental results demonstrate that our approach outperforms existing methods in terms of both performance and planning efficiency.

arxiv情報

著者 Wenhao Li,Shishun Zhang,Sisi Dai,Hui Huang,Ruizhen Hu,Xiaohong Chen,Kai Xu
発行日 2024-03-13 02:26:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク