要約
タイトル:共通情報アプローチを用いたマルチエージェント制御のための新しいポイントベースアルゴリズム
要約:
– 共通情報(CI)アプローチは、マルチエージェントの確率制御問題を、コーディネーターのPOMDPと呼ばれる単一エージェントの部分的に観測されたマルコフ決定問題に変換するための体系的な方法を提供する。
– しかし、そのようなPOMDPは行動空間が非常に大きいため、解くのが困難になることがある。
– 我々は、コーディネーターのヒューリスティック探索値反復(CHSVI)というマルチエージェント確率制御問題のための新しいアルゴリズムを提案している。
– このアルゴリズムは、CIアプローチとポイントベースPOMDPアルゴリズムを組み合わせ、大規模な行動空間の最適解決に取り組むことができる。
– 我々は、このアルゴリズムが、いくつかのベンチマーク問題を最適に解決することをデモンストレーションしている。
要約(オリジナル)
The Common Information (CI) approach provides a systematic way to transform a multi-agent stochastic control problem to a single-agent partially observed Markov decision problem (POMDP) called the coordinator’s POMDP. However, such a POMDP can be hard to solve due to its extraordinarily large action space. We propose a new algorithm for multi-agent stochastic control problems, called coordinator’s heuristic search value iteration (CHSVI), that combines the CI approach and point-based POMDP algorithms for large action spaces. We demonstrate the algorithm through optimally solving several benchmark problems.
arxiv情報
著者 | Dengwang Tang,Ashutosh Nayyar,Rahul Jain |
発行日 | 2023-04-10 01:27:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI