要約
この論文では、時間的および到達可能性の制約の下で複雑な連続ダイナミクスを伴う非決定性ハイブリッド システム用のサンプリング ベースの戦略合成アルゴリズムを紹介します。
ハイブリッド システムの進化を 2 プレイヤー ゲームとしてモデル化します。このゲームでは、非決定性は時間的および到達可能性の目標の達成を妨げることを目的とする敵対的なプレイヤーです。
目的は、勝利の戦略、つまり敵対プレイヤーのあらゆる可能な動きの下で目標の達成を保証する反応的な (堅牢な) 戦略を合成することです。
私たちが提案するアプローチには、サンプリングベースの動作計画と部分戦略を選択して改善する新しいバンディットベースの手法を組み合わせることにより、ハイブリッド空間で(検索)ゲームツリーを成長させることが含まれます。
アルゴリズムが確率的に完全であること、つまり、アルゴリズムが勝利戦略が存在する場合、漸近的にほぼ確実にそれを見つけることを示します。
ケーススタディとベンチマークの結果は、当社のアルゴリズムが汎用的かつ効果的であり、常に最先端のアルゴリズムを上回るパフォーマンスを示していることを示しています。
要約(オリジナル)
This paper introduces a sampling-based strategy synthesis algorithm for nondeterministic hybrid systems with complex continuous dynamics under temporal and reachability constraints. We model the evolution of the hybrid system as a two-player game, where the nondeterminism is an adversarial player whose objective is to prevent achieving temporal and reachability goals. The aim is to synthesize a winning strategy — a reactive (robust) strategy that guarantees the satisfaction of the goals under all possible moves of the adversarial player. Our proposed approach involves growing a (search) game-tree in the hybrid space by combining sampling-based motion planning with a novel bandit-based technique to select and improve on partial strategies. We show that the algorithm is probabilistically complete, i.e., the algorithm will asymptotically almost surely find a winning strategy, if one exists. The case studies and benchmark results show that our algorithm is general and effective, and consistently outperforms state of the art algorithms.
arxiv情報
著者 | Qi Heng Ho,Zachary N. Sunberg,Morteza Lahijanian |
発行日 | 2023-12-23 22:13:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google