Desensitization and Deception in Differential Games with Asymmetric Information

要約

非感作では、感度関数に基づいたリスク推定値を提供することで、パラメトリックな不確実性の下での安全な最適な計画に対処します。
この論文は、2 プレイヤー差動ゲームのクラスの安全な計画に対処するために、最適制御における感度の低下に関する既存の研究を拡張します。
提案されたゲームでは、パラメトリックな不確実性は、各プレーヤーの公称値に関するモデル パラメーターの変動に対応します。
提案された定式化における 2 人のプレーヤーは、これらの名目パラメータ値についての完全な情報を持っていると想定されます。
ただし、実際のパラメータ値を完全に知っているのはプレイヤーの 1 人だけであると想定されているため、提案されたゲームでは情報の非対称性が生じます。
パラメータの変動に関する知識の欠如により、情報上の不利な点を持つプレイヤーが状態制約違反を引き起こすことが予想されます。
この点に関して、不完全な情報を持つプレーヤーに対して安全な軌道を提供する鈍感なフィードバック戦略が提案されています。
提案されたフィードバック戦略は、不確実な移動障害物を伴う単一の追跡者と単一の回避者が関与する例で評価されます。この場合、追跡者は障害物の速度の公称値のみを知っていると想定されます。
同時に、回避者は障害物の実際の速度を知っており、追跡者は障害物の速度の名目上の値しか知らないという事実も知っています。
続いて、情報上の優位性を持つ回避者に対して欺瞞的な戦略が提案され、これらの戦略は追跡者の鈍感な戦略に対して評価されます。

要約(オリジナル)

Desensitization addresses safe optimal planning under parametric uncertainties by providing sensitivity function-based risk estimates. This paper expands upon the existing work on desensitization in optimal control to address safe planning for a class of two-player differential games. In the proposed game, parametric uncertainties correspond to variations of the model parameters for each player about their nominal values. The two players in the proposed formulation are assumed to have perfect information about these nominal parameter values. However, it is assumed that only one of the players has complete knowledge of the actual parameter value, resulting in information asymmetry in the proposed game. This lack of knowledge regarding the parameter variations is expected to result in state constraint violations for the player with an information disadvantage. In this regard, a desensitized feedback strategy that provides safe trajectories is proposed for the player with incomplete information. The proposed feedback strategy is evaluated for instances involving a single pursuer and a single evader with an uncertain moving obstacle, where the pursuer is assumed to only know the nominal value of the obstacle’s speed. At the same time, the evader knows the obstacle’s true speed, and also the fact that the pursuer knows only the nominal value of the obstacle’s speed. Subsequently, deceptive strategies are proposed for the evader, who has an information advantage, and these strategies are assessed against the pursuer’s desensitized strategy.

arxiv情報

著者 Vinodhini Comandur,Tulasi Ram Vechalapu,Venkata Ramana Makkapati,Panagiotis Tsiotras,Seth Hutchinson
発行日 2024-02-07 01:24:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY, math.OC パーマリンク