要約
欺ceptiveなパス計画(DPP)の既存の方法に対処します。パスをパスを設計する問題に対処します。
このような方法は、観察者が経路計画エージェントを妨げるために敵対的な介入を実行する能力を持っている問題には適用されません。
この論文では、DPPポリシーの設計を導くために、敵対的介入の下でDPP問題の新しいマルコフ決定プロセス(MDP)ベースのモデルを提案し、情報の新しい価値(VOI)目的を開発します。
私たちが提案するVOIの目的を使用して、パス計画エージェントは、観察者にとって情報価値が低い軌跡を選択することにより、敵対的なオブザーバーを欺き、最適でない介入を選択します。
MDPの線形プログラミング理論への接続を活用すると、敵対的介入の下でDPPを実行するためのポリシーを合成するための計算効率的なソリューション方法を導き出します。
私たちの実験では、敵対的な介入の下で欺ceptiveningを達成する上で提案されたソリューション法の有効性を説明し、既存のDPPメソッドと実例のあるグリッドワールドの問題に関する保守的な経路計画アプローチの両方に対するアプローチの優れたパフォーマンスを実証します。
要約(オリジナル)
Existing methods for deceptive path planning (DPP) address the problem of designing paths that conceal their true goal from a passive, external observer. Such methods do not apply to problems where the observer has the ability to perform adversarial interventions to impede the path planning agent. In this paper, we propose a novel Markov decision process (MDP)-based model for the DPP problem under adversarial interventions and develop new value of information (VoI) objectives to guide the design of DPP policies. Using the VoI objectives we propose, path planning agents deceive the adversarial observer into choosing suboptimal interventions by selecting trajectories that are of low informational value to the observer. Leveraging connections to the linear programming theory for MDPs, we derive computationally efficient solution methods for synthesizing policies for performing DPP under adversarial interventions. In our experiments, we illustrate the effectiveness of the proposed solution method in achieving deceptiveness under adversarial interventions and demonstrate the superior performance of our approach to both existing DPP methods and conservative path planning approaches on illustrative gridworld problems.
arxiv情報
著者 | Wesley A. Suttle,Jesse Milzman,Mustafa O. Karabag,Brian M. Sadler,Ufuk Topcu |
発行日 | 2025-03-31 16:31:29+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google