要約
多くの好みの誘発アルゴリズムは、異なる属性を持つ命題論理式またはアイテムに対する優先を考慮します。
順次の意思決定では、ユーザーの好みは、可能性のある結果よりも予約注文することができます。それぞれが一時的なイベントシーケンスです。
このペーパーでは、ユーザーの不明な好みが、時間目標と呼ばれる通常の言語(時間シーケンスのセット)を超える予約注文によって表される優先推論の問題のクラスを考慮します。
有限の単語間の有限のペアワイズ比較セットを考えると、目的は、これらの目標を超える一時的な目標のセットと事前注文の両方を学習することです。
最初に、一時的な目標をめぐる優先関係が、受理条件よりも予約注文で増強された決定論的な有限オートマトンである優先決定論的有限オートマトン(PDFA)によってモデル化できることを示します。
優先推論の問題は、PDFAの学習に減少します。
この問題は計算上挑戦的であることが示されており、特定の整数$ k $よりも小さいサイズのPDFAが存在するかどうかを判断する問題は、サンプルと一致し、NP不完全です。
特徴的なサンプルの特性を形式化し、特徴的なサンプルを考慮して、学習を保証するアルゴリズムを開発します。これは、サンプルが描画される真のPDFAに相当する最小限のPDFAです。
ランニングの例を介してこの方法を提示し、ロボットモーション計画の問題を使用して詳細な分析を提供します。
要約(オリジナル)
Many preference elicitation algorithms consider preference over propositional logic formulas or items with different attributes. In sequential decision making, a user’s preference can be a preorder over possible outcomes, each of which is a temporal sequence of events. This paper considers a class of preference inference problems where the user’s unknown preference is represented by a preorder over regular languages (sets of temporal sequences), referred to as temporal goals. Given a finite set of pairwise comparisons between finite words, the objective is to learn both the set of temporal goals and the preorder over these goals. We first show that a preference relation over temporal goals can be modeled by a Preference Deterministic Finite Automaton (PDFA), which is a deterministic finite automaton augmented with a preorder over acceptance conditions. The problem of preference inference reduces to learning the PDFA. This problem is shown to be computationally challenging, with the problem of determining whether there exists a PDFA of size smaller than a given integer $k$, consistent with the sample, being NP-Complete. We formalize the properties of characteristic samples and develop an algorithm that guarantees to learn, given a characteristic sample, the minimal PDFA equivalent to the true PDFA from which the sample is drawn. We present the method through a running example and provide detailed analysis using a robotic motion planning problem.
arxiv情報
著者 | Hazhar Rahmani,Jie Fu |
発行日 | 2025-05-23 15:35:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google