要約
この研究は、異種マルチロボット フリートのコンテキストにおけるフリート設計の最適化の課題に取り組み、パフォーマンスとコストのバランスがとれた実現可能な設計を取得することを目的としています。
自律的なマルチロボット探索の領域では、強化学習エージェントが中心的な役割を果たし、複雑な地形への適応性を提供し、ロボット間のコラボレーションを促進します。
ただし、フリートの構成を変更すると学習された動作が変化するため、マルチエージェント強化学習を使用してマルチロボット システムをトレーニングするにはコストがかかります。
したがって、潜在的なフリート設計のそれぞれを徹底的に評価することは不可能です。
これらのハードルに取り組むために、設計空間の不確実性を考慮しながら、パフォーマンスとコストのパレート面でフリートを探索する多目的ベイズ最適化を活用するフレームワークであるフリート設計のためのベイズ最適化 (BOFD) を紹介します。
さらに、累積後悔の線形未満の限界を確立し、BOFD の堅牢性と有効性を裏付けます。
合成環境およびシミュレート環境での広範なベンチマーク実験により、最先端の手法に対する当社のフレームワークの優位性が実証され、最小限のフリート評価で効率的なフリート設計が実現されます。
要約(オリジナル)
This study addresses the challenge of fleet design optimization in the context of heterogeneous multi-robot fleets, aiming to obtain feasible designs that balance performance and costs. In the domain of autonomous multi-robot exploration, reinforcement learning agents play a central role, offering adaptability to complex terrains and facilitating collaboration among robots. However, modifying the fleet composition results in changes in the learned behavior, and training multi-robot systems using multi-agent reinforcement learning is expensive. Therefore, an exhaustive evaluation of each potential fleet design is infeasible. To tackle these hurdles, we introduce Bayesian Optimization for Fleet Design (BOFD), a framework leveraging multi-objective Bayesian Optimization to explore fleets on the Pareto front of performance and cost while accounting for uncertainty in the design space. Moreover, we establish a sub-linear bound for cumulative regret, supporting BOFD’s robustness and efficacy. Extensive benchmark experiments in synthetic and simulated environments demonstrate the superiority of our framework over state-of-the-art methods, achieving efficient fleet designs with minimal fleet evaluations.
arxiv情報
著者 | David Molina Concha,Jiping Li,Haoran Yin,Kyeonghyeon Park,Hyun-Rok Lee,Taesik Lee,Dhruv Sirohi,Chi-Guhn Lee |
発行日 | 2024-08-21 16:22:51+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google