Map Prediction and Generative Entropy for Multi-Agent Exploration

要約

従来、自律型偵察アプリケーションは、明示的な一連の履歴観察に基づいて動作してきました。
最近の生成技術の進歩により、この研究により、ロボット チームは、シーンの合理的な解釈の分布を推測することで、環境について現在知られている以上の行動を行うことができます。
私たちは、探査ミッション中にマルチエージェントの 2D 占有マップで未知の空間を修復するマップ プレディクターを開発しました。
いくつかの修復方法の比較から、微調整された潜在拡散修復モデルは、比較的短い計算時間で、シミュレートされた都市環境の豊富で一貫した解釈を提供できることがわかりました。
探査の実行を通じてシーンの解釈を繰り返し推論することにより、予測において高い不確実性を示す領域を特定することができ、これを生成エントロピーの概念で定式化します。
私たちは、生成エントロピーの高い領域のタスクに優先順位を付け、これによりシーンの正確な予測マップへの収束が促進されるという仮説を立てています。
私たちの研究では、タスクのランク付けのこの新しいパラダイムと、予想される情報の回復を最大化する領域によって探索する領域をランク付けする最先端のパラダイムを並列させます。
3 台の車両を使用したシミュレートされた都市環境でこれらの方法の両方を比較します。
私たちの結果は、新しいタスクランキング手法を使用することで、従来の情報に基づく手法よりも大幅に速く正しいシーンを予測できることを示しています。

要約(オリジナル)

Traditionally, autonomous reconnaissance applications have acted on explicit sets of historical observations. Aided by recent breakthroughs in generative technologies, this work enables robot teams to act beyond what is currently known about the environment by inferring a distribution of reasonable interpretations of the scene. We developed a map predictor that inpaints the unknown space in a multi-agent 2D occupancy map during an exploration mission. From a comparison of several inpainting methods, we found that a fine-tuned latent diffusion inpainting model could provide rich and coherent interpretations of simulated urban environments with relatively little computation time. By iteratively inferring interpretations of the scene throughout an exploration run, we are able to identify areas that exhibit high uncertainty in the prediction, which we formalize with the concept of generative entropy. We prioritize tasks in regions of high generative entropy, hypothesizing that this will expedite convergence on an accurate predicted map of the scene. In our study we juxtapose this new paradigm of task ranking with the state of the art, which ranks regions to explore by those which maximize expected information recovery. We compare both of these methods in a simulated urban environment with three vehicles. Our results demonstrate that by using our new task ranking method, we can predict a correct scene significantly faster than with a traditional information-guided method.

arxiv情報

著者 Alexander Spinos,Bradley Woosley,Justin Rokisky,Christopher Korpela,John G. Rogers III,Brian A. Bittner
発行日 2025-01-22 19:40:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.RO パーマリンク