Decentralized and Asymmetric Multi-Agent Learning in Construction Sites

要約

マルチエージェント コラボレーションでは、複数の参加者が共有環境で協力して共通の目標を達成します。
これらのエージェントは情報を共有し、タスクを分割し、アクションを同期します。
マルチエージェントのコラボレーションの重要な側面には、調整、コミュニケーション、タスクの割り当て、協力、適応、分散化が含まれます。
建設現場では、表面のグレーディングは、特定のエリアの高さを高めるために砂の山を平らにするプロセスです。
このシナリオでは、ブルドーザーが整地を行い、ダンプが砂の山を割り当てます。
私たちの取り組みは、マルチエージェント アプローチを利用して、これらの車両が効果的に連携できるようにすることを目的としています。
この目的を達成するために、建設現場向けの分散型で非対称なマルチエージェント学習アプローチ (DAMALCS) を提案します。
私たちは、走行中の車両に予想される衝突を軽減するための DAMALCS を策定します。
したがって、革新的な優先順位付け方法を適用することで、共同の目標を最適に達成できる 2 人のヒューリスティック エキスパートを開発します。
このアプローチでは、ブルドーザーの動きがダンパーの操作よりも優先されるため、ブルドーザーがダンパーの進路を空けることができ、両方の車両の継続的な操作が保証されます。
現実世界のシナリオではヒューリスティックだけでは不十分であるため、AI エージェントのトレーニングにヒューリスティックを活用し、非常に効果的であることが証明されています。
私たちはブルドーザーとダンパーのエージェントが同じ環境内で動作するように同時にトレーニングし、衝突を回避し、時間効率と砂の量の処理の観点からパフォーマンスを最適化することを目指しています。
当社の訓練を受けたエージェントとヒューリスティックは、シミュレーションと実際のラボ実験の両方で評価され、視覚的なノイズや位置特定エラーなどのさまざまな条件下でテストされます。
結果は、私たちのアプローチがこれらの車両の衝突率を大幅に減少させることを示しています。

要約(オリジナル)

Multi-agent collaboration involves multiple participants working together in a shared environment to achieve a common goal. These agents share information, divide tasks, and synchronize their actions. Key aspects of multi agent collaboration include coordination, communication, task allocation, cooperation, adaptation, and decentralization. On construction sites, surface grading is the process of leveling sand piles to increase a specific area’s height. In this scenario, a bulldozer grades while a dumper allocates sand piles. Our work aims to utilize a multi-agent approach to enable these vehicles to collaborate effectively. To this end, we propose a decentralized and asymmetric multi-agent learning approach for construction sites (DAMALCS). We formulate DAMALCS to reduce expected collisions for operating vehicles. Therefore, we develop two heuristic experts capable of achieving their joint goal optimally by applying an innovative prioritization method. In this approach, the bulldozer’s movements take precedence over the dumper’s operations, enabling the bulldozer to clear the path for the dumper and ensure continuous operation of both vehicles. Since heuristics alone are insufficient in real-world scenarios, we utilize them to train AI agents, which proves to be highly effective. We simultaneously train the bulldozer and dumper agents to operate within the same environment, aiming to avoid collisions and optimize performance in terms of time efficiency and sand volume handling. Our trained agents and heuristics are evaluated in both simulation and real-world lab experiments, testing them under various conditions, such as visual noise and localization errors. The results demonstrate that our approach significantly reduces collision rates for these vehicles.

arxiv情報

著者 Yakov Miron,Dan Navon,Yuval Goldfracht,Dotan Di Castro,Itzik Klein
発行日 2024-09-16 15:16:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク