Decentralized policy learning with partial observation and mechanical constraints for multiperson modeling

要約

実世界のマルチエージェント行動のルールを抽出することは、様々な科学・工学分野における現在の課題である。しかし、従来のデータ駆動型モデルの多くは、このような仮定を無視しているため、生物学的な妥当性や行動解析におけるモデルの解釈可能性に欠けている。本論文では、エージェントの認知と身体ダイナミクスをモデル化し、生物学的に妥当な行動を予測することができる、部分的な観測制約と力学的制約を持つ逐次生成モデルを分散型手法で提案する。この問題は、二値部分観測と、物理的および生体力学的なペナルティを持つ階層的変分リカレントニューラルネットワークに基づく分散型政策モデルを活用し、分散型マルチエージェント模倣学習問題として定式化される。実際のバスケットボールとサッカーのデータセットを用いて、制約違反、長期軌道予測、部分観測の観点から、本手法の有効性を示す。本手法は、実世界のデータを用いて現実的な軌道を生成するマルチエージェントシミュレータとして利用可能である。

要約(オリジナル)

Extracting the rules of real-world multi-agent behaviors is a current challenge in various scientific and engineering fields. Biological agents independently have limited observation and mechanical constraints; however, most of the conventional data-driven models ignore such assumptions, resulting in lack of biological plausibility and model interpretability for behavioral analyses. Here we propose sequential generative models with partial observation and mechanical constraints in a decentralized manner, which can model agents’ cognition and body dynamics, and predict biologically plausible behaviors. We formulate this as a decentralized multi-agent imitation-learning problem, leveraging binary partial observation and decentralized policy models based on hierarchical variational recurrent neural networks with physical and biomechanical penalties. Using real-world basketball and soccer datasets, we show the effectiveness of our method in terms of the constraint violations, long-term trajectory prediction, and partial observation. Our approach can be used as a multi-agent simulator to generate realistic trajectories using real-world data.

arxiv情報

著者 Keisuke Fujii,Naoya Takeishi,Yoshinobu Kawahara,Kazuya Takeda
発行日 2023-12-01 14:19:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.MA, stat.ML パーマリンク