Beyond Winning Strategies: Admissible and Admissible Winning Strategies for Quantitative Reachability Games

要約

古典的な反応性合成アプローチは、特定の仕様を常に満たすリアクティブシステムを合成することを目的としています。
これらのアプローチは、多くの場合、勝利戦略を統合することを目標とする2人のゼロサムゲームをプレイすることに減少します。
ただし、ロボット工学などの多くの実用的なドメインでは、勝利戦略が常に存在するとは限りませんが、システムが「あきらめる」のではなく、要件を満たす努力をすることが望ましいです。
この目的のために、このペーパーでは、定量的な到達可能性ゲームにおいて「ベストを実行する」ことを正式化する許容戦略の概念を調査します。
定性的なケースとは異なり、定量的許容戦略は有限のペイオフ関数であっても履歴依存であり、合成が困難なタスクになることを示しています。
さらに、許容可能な戦略は常に存在するが、望ましくない楽観的な行動を生み出す可能性があることを証明します。
これを緩和するために、私たちは許容される勝利戦略を提案します。
両方の戦略が常に存在しますが、記憶がないことを示しています。
両方の戦略の存在に必要かつ十分な条件を提供し、合成アルゴリズムを提案します。
最後に、GridWorldおよびRobotマニピュレータードメインの戦略を説明します。

要約(オリジナル)

Classical reactive synthesis approaches aim to synthesize a reactive system that always satisfies a given specifications. These approaches often reduce to playing a two-player zero-sum game where the goal is to synthesize a winning strategy. However, in many pragmatic domains, such as robotics, a winning strategy does not always exist, yet it is desirable for the system to make an effort to satisfy its requirements instead of ‘giving up’. To this end, this paper investigates the notion of admissible strategies, which formalize ‘doing-your-best’, in quantitative reachability games. We show that, unlike the qualitative case, quantitative admissible strategies are history-dependent even for finite payoff functions, making synthesis a challenging task. In addition, we prove that admissible strategies always exist but may produce undesirable optimistic behaviors. To mitigate this, we propose admissible winning strategies, which enforce the best possible outcome while being admissible. We show that both strategies always exist but are not memoryless. We provide necessary and sufficient conditions for the existence of both strategies and propose synthesis algorithms. Finally, we illustrate the strategies on gridworld and robot manipulator domains.

arxiv情報

著者 Karan Muvvala,Qi Heng Ho,Morteza Lahijanian
発行日 2025-04-30 17:51:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.FL, cs.GT, cs.LO, cs.RO, D.2.4 パーマリンク