Probabilistic Planning with Prioritized Preferences over Temporal Logic Objectives

要約

タイトル:優先度付き優先順位を持った確率的な時空論理目的に対する確率的な計画

要約:
– この論文は、ユーザーが複数の時空目標に対する優先度を持つ、ラベル付きマルコフ決定過程(MDP)モデルを用いた確率的環境における時間的計画について研究する。
– 既存の研究は優先順位付きの目標のリストとしてこれらの優先度を反映している。この論文は、優先順位付き定量的選択線形時間論理を有限トレースに導入することで、有限トレース上の線形時間論理に優先順位つきの連言と順序つきの選言を追加する新しい仕様言語を提供する。
– この言語は、対応する優先度を持つ時間的目的を簡潔に指定することができる。システムの動作を記述する有限トレースは、式に関する不満点スコアに基づいて順位づけされる。
– 著者らは、新しい言語から加重決定的有限オートマトンへの系統的な変換を提案する。この計算モデルを利用して、ユーザーの優先度を考慮して不満点スコアの期待値を最小化する最適ポリシーを計算する問題を定式化し、解決する。
– 著者らは、ロジックとアルゴリズムの効果と適用性を、それぞれ詳細な分析を伴ういくつかのケーススタディで実証する。

要約(オリジナル)

This paper studies temporal planning in probabilistic environments, modeled as labeled Markov decision processes (MDPs), with user preferences over multiple temporal goals. Existing works reflect such preferences as a prioritized list of goals. This paper introduces a new specification language, termed prioritized qualitative choice linear temporal logic on finite traces, which augments linear temporal logic on finite traces with prioritized conjunction and ordered disjunction from prioritized qualitative choice logic. This language allows for succinctly specifying temporal objectives with corresponding preferences accomplishing each temporal task. The finite traces that describe the system’s behaviors are ranked based on their dissatisfaction scores with respect to the formula. We propose a systematic translation from the new language to a weighted deterministic finite automaton. Utilizing this computational model, we formulate and solve a problem of computing an optimal policy that minimizes the expected score of dissatisfaction given user preferences. We demonstrate the efficacy and applicability of the logic and the algorithm on several case studies with detailed analyses for each.

arxiv情報

著者 Lening Li,Hazhar Rahmani,Jie Fu
発行日 2023-04-23 13:03:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.FL パーマリンク