要約
近年、マルチエージェント強化学習(MARL)を用いた歩行者のシミュレーションが研究されている。
この研究では、グリッドワールド環境上の道路を考慮し、エコー状態ネットワークと最小二乗ポリシー反復法を使用して歩行者を MARL エージェントとして実装しました。
この環境下で、これらのエージェントが他のエージェントを避けて前進することを学習する能力が調査されました。
具体的には、狭い直線ルートと広い迂回ルートの選択と、通路における双方向の歩行者動線の2種類のタスクを検討しました。
シミュレーション結果は、エージェントの密度がそれほど高くない場合に学習が成功したことを示しました。
要約(オリジナル)
In recent years, simulations of pedestrians using the multi-agent reinforcement learning (MARL) have been studied. This study considered the roads on a grid-world environment, and implemented pedestrians as MARL agents using an echo-state network and the least squares policy iteration method. Under this environment, the ability of these agents to learn to move forward by avoiding other agents was investigated. Specifically, we considered two types of tasks: the choice between a narrow direct route and a broad detour, and the bidirectional pedestrian flow in a corridor. The simulations results indicated that the learning was successful when the density of the agents was not that high.
arxiv情報
著者 | Hisato Komatsu |
発行日 | 2024-03-25 07:00:29+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google