要約
この研究では、自動運転車に適用して、指定された仕様を確実に遵守する好みの学習方法を紹介します。
私たちのアプローチは、交通ルールを記述する信号時相論理 (STL) 式の優先順位を学習フレームワークに組み込んでいます。
パラメトリック加重信号時間論理 (PWSTL) を活用することで、ペアごとの比較に基づいた安全性が保証された優先学習の問題を定式化し、この学習問題を解決するアプローチを提案します。
私たちのアプローチは、特定の PWSTL 式の重みの実現可能な評価を見つけます。このような重みを使用すると、優先信号の重み付けされた定量的満足度の尺度が非優先信号よりも大きくなります。
私たちのアプローチによって与えられる重みの実現可能な評価は、構築による修正とカスタムのコントローラー合成で使用できる重み付き STL 式につながります。
一時停止標識と横断歩道を含む 2 つの異なる模擬運転シナリオで、人間を対象としたパイロット研究を使用して、この方法のパフォーマンスを実証します。
私たちのアプローチは、好みを捕捉するという点で既存の好み学習方法と比較して競争力のある結果をもたらし、安全性を考慮すると特に優れています。
要約(オリジナル)
This work introduces a preference learning method that ensures adherence to given specifications, with an application to autonomous vehicles. Our approach incorporates the priority ordering of Signal Temporal Logic (STL) formulas describing traffic rules into a learning framework. By leveraging Parametric Weighted Signal Temporal Logic (PWSTL), we formulate the problem of safety-guaranteed preference learning based on pairwise comparisons and propose an approach to solve this learning problem. Our approach finds a feasible valuation for the weights of the given PWSTL formula such that, with these weights, preferred signals have weighted quantitative satisfaction measures greater than their non-preferred counterparts. The feasible valuation of weights given by our approach leads to a weighted STL formula that can be used in correct-and-custom-by-construction controller synthesis. We demonstrate the performance of our method with a pilot human subject study in two different simulated driving scenarios involving a stop sign and a pedestrian crossing. Our approach yields competitive results compared to existing preference learning methods in terms of capturing preferences and notably outperforms them when safety is considered.
arxiv情報
著者 | Ruya Karagulle,Nikos Arechiga,Andrew Best,Jonathan DeCastro,Necmiye Ozay |
発行日 | 2024-03-26 14:25:52+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google