Reinforcement Learning of Multi-robot Task Allocation for Multi-object Transportation with Infeasible Tasks

要約

マルチロボットシステムを用いた多物搬送は、効率的な個別かつ拡張性のある協調搬送により、配送サービスなど多様な実用化の可能性を秘めています。
ただし、重量が不明な物体の輸送タスクを割り当てることは依然として困難です。
さらに、実行不可能なタスク (輸送不可能なオブジェクト) の存在により、ロボットの停止 (デッドロック) が発生する可能性があります。
この論文は、ロボットの数に関してスケーラブルな方法で各タスクのタスク経験を保存することを伴う、動的なタスク割り当てのフレームワークを提案します。
まず、これらのエクスペリエンスがクラウド サーバーからロボット システム全体にブロードキャストされます。
その後、各ロボットはそれらのタスクの経験に基づいて各タスクの除外レベルを学習し、実行不可能なタスクを除外し、タスクの優先順位を再設定できるようになります。
最後に、個別輸送、共同輸送、および実行不可能と思われるタスクの一時的な除外が実現されます。
提案手法の拡張性と汎用性は、未学習の重量オブジェクトを含むロボットとオブジェクトの数を増やした数値実験によって確認されました。
一時的なデッドロック回避の有効性は、エピソード内に追加のロボットを導入することによっても確認されました。
提案された方法により、実現可能性を事前に考慮することなく、さまざまな数のロボットやさまざまな輸送タスクに対して実現可能なタスク割り当て戦略の実装が可能になります。

要約(オリジナル)

Multi-object transport using multi-robot systems has the potential for diverse practical applications such as delivery services owing to its efficient individual and scalable cooperative transport. However, allocating transportation tasks of objects with unknown weights remains challenging. Moreover, the presence of infeasible tasks (untransportable objects) can lead to robot stoppage (deadlock). This paper proposes a framework for dynamic task allocation that involves storing task experiences for each task in a scalable manner with respect to the number of robots. First, these experiences are broadcasted from the cloud server to the entire robot system. Subsequently, each robot learns the exclusion levels for each task based on those task experiences, enabling it to exclude infeasible tasks and reset its task priorities. Finally, individual transportation, cooperative transportation, and the temporary exclusion of tasks considered infeasible are achieved. The scalability and versatility of the proposed method were confirmed through numerical experiments with an increased number of robots and objects, including unlearned weight objects. The effectiveness of the temporary deadlock avoidance was also confirmed by introducing additional robots within an episode. The proposed method enables the implementation of task allocation strategies that are feasible for different numbers of robots and various transport tasks without prior consideration of feasibility.

arxiv情報

著者 Yuma Shida,Tomohiko Jimbo,Tadashi Odashima,Takamitsu Matsubara
発行日 2024-04-18 00:33:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク