Information Gain Is Not All You Need

要約

モバイルロボット工学の自律的な探査は、環境を徹底的に観察するためのカバレッジの2つの競合する目的によって推進されます。
そして、パスの長さ、可能な限り短いパスでそうするために。
未知を知らずに最良の行動を評価することは困難ですが、未知のものはモデル、地図、または常識を通してしばしば理解できます。
しかし、以前の研究では、そのような事前知識を通じて情報の推定値を改善することで貪欲な行動につながり、最終的にバックトラッキングを引き起こすことが示されています。
実際、情報の最大化は、事前の知識がなくても、この動作を示します。
タスクの完了時に得られた情報は一定であり、最大化することはできません。
したがって、最適化の目的として不適切な選択です。
代わりに、情報のゲインは、どの候補者状態が探査のために考慮されるべきかを決定するための決定基準です。
したがって、タスクは、最短合計パスで完了に達するようになります。
通常、最短のパスを決定することは通常手に負えないため、総パスの長さを最小化する候補者を特定するために、ヒューリスティックまたは推定に依存する必要があります。
これに対処するために、ロボットに近いが他の候補国から遠く離れた候補国を好むことにより、バックトラッキングを減らすヒューリスティックを提案します。
情報ゲインベースのアプローチとフロンティア探査に対して、提案されたヒューリスティックのシミュレーションのパフォーマンスを評価し、環境の事前知識の有無にかかわらず、この方法が総パス長を大幅に減少させることを示します。

要約(オリジナル)

Autonomous exploration in mobile robotics is driven by two competing objectives: coverage, to exhaustively observe the environment; and path length, to do so with the shortest path possible. Though it is difficult to evaluate the best course of action without knowing the unknown, the unknown can often be understood through models, maps, or common sense. However, previous work has shown that improving estimates of information gain through such prior knowledge leads to greedy behavior and ultimately causes backtracking, which degrades coverage performance. In fact, any information gain maximization will exhibit this behavior, even without prior knowledge. Information gained at task completion is constant, and cannot be maximized for. It is therefore an unsuitable choice as an optimization objective. Instead, information gain is a decision criterion for determining which candidate states should still be considered for exploration. The task therefore becomes to reach completion with the shortest total path. Since determining the shortest path is typically intractable, it is necessary to rely on a heuristic or estimate to identify candidate states that minimize the total path length. To address this, we propose a heuristic that reduces backtracking by preferring candidate states that are close to the robot, but far away from other candidate states. We evaluate the performance of the proposed heuristic in simulation against an information gain-based approach and frontier exploration, and show that our method significantly decreases total path length, both with and without prior knowledge of the environment.

arxiv情報

著者 Ludvig Ericson,José Pedro,Patric Jensfelt
発行日 2025-04-10 13:43:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク