Learning Multi-agent Multi-machine Tending by Mobile Robots

要約

ロボット工学は、製造業の成長する労働者不足の課題に対処するのに役立ちます。
そのため、Machine Thingはタスクコラボレーションロボットに取り組むことができるタスクであり、生産性を高めることができます。
それにもかかわらず、そのセクターに展開されている既存のロボットシステムは、固定されたシングルアームセットアップに依存していますが、モバイルロボットはより柔軟性とスケーラビリティを提供できます。
この作業では、適切な観察と報酬の設計を備えたマルチエージェント強化学習(MARL)技術に基づいて、モバイルロボットによるマルチエージェントマルチマシンティング学習フレームワークを紹介します。
さらに、注意ベースのエンコーディングメカニズムが開発され、マルチ式の近位ポリシー最適化(MAPPO)アルゴリズムに統合され、機械式シナリオのパフォーマンスを向上させます。
私たちのモデル(AB-Mappo)は、タスクの成功、安全性、リソースの利用に関して、この新しい挑戦的なシナリオでマッポを上回りました。
さらに、さまざまな設計上の決定をサポートするために、広範なアブレーション研究を提供しました。

要約(オリジナル)

Robotics can help address the growing worker shortage challenge of the manufacturing industry. As such, machine tending is a task collaborative robots can tackle that can also highly boost productivity. Nevertheless, existing robotics systems deployed in that sector rely on a fixed single-arm setup, whereas mobile robots can provide more flexibility and scalability. In this work, we introduce a multi-agent multi-machine tending learning framework by mobile robots based on Multi-agent Reinforcement Learning (MARL) techniques with the design of a suitable observation and reward. Moreover, an attention-based encoding mechanism is developed and integrated into Multi-agent Proximal Policy Optimization (MAPPO) algorithm to boost its performance for machine tending scenarios. Our model (AB-MAPPO) outperformed MAPPO in this new challenging scenario in terms of task success, safety, and resources utilization. Furthermore, we provided an extensive ablation study to support our various design decisions.

arxiv情報

著者 Abdalwhab Abdalwhab,Giovanni Beltrame,Samira Ebrahimi Kahou,David St-Onge
発行日 2025-02-25 16:28:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク