Specification-Guided Data Aggregation for Semantically Aware Imitation Learning

要約

シミュレーションと正式な手法に基づく環境サンプリングの進歩により、自動運転などの多くの安全性が重要なシナリオでの機械学習モデルの厳密な評価が可能になりました。
学習したモデル自体を改善するためのこれらの環境サンプリング手法の適用は、まだ十分に活用されていません。
この作業では、新しい環境で専門家データを集約する手段として、仕様に基づくサンプリング手法を活用することにより、模倣学習モデルを意味論的に認識した方法で改善するための新しい方法を紹介します。
具体的には、可能な環境の空間を意味的に類似した領域に分割する手段として一連の正式な仕様を作成し、学習した模倣が専門家と最も異なる動作をするこの分割の要素を特定します。
次に、これらの特定された領域の環境に関する専門家データを集約し、専門家の行動セマンティクスをより正確に模倣します。
CARLAドライビングシミュレーターでの一連の実験で私たちのアプローチをインスタンス化し、私たちのアプローチが他の環境サンプリング方法で学習したモデルよりも正確なモデルにつながることを実証します.

要約(オリジナル)

Advancements in simulation and formal methods-guided environment sampling have enabled the rigorous evaluation of machine learning models in a number of safety-critical scenarios, such as autonomous driving. Application of these environment sampling techniques towards improving the learned models themselves has yet to be fully exploited. In this work, we introduce a novel method for improving imitation-learned models in a semantically aware fashion by leveraging specification-guided sampling techniques as a means of aggregating expert data in new environments. Specifically, we create a set of formal specifications as a means of partitioning the space of possible environments into semantically similar regions, and identify elements of this partition where our learned imitation behaves most differently from the expert. We then aggregate expert data on environments in these identified regions, leading to more accurate imitation of the expert’s behavior semantics. We instantiate our approach in a series of experiments in the CARLA driving simulator, and demonstrate that our approach leads to models that are more accurate than those learned with other environment sampling methods.

arxiv情報

著者 Ameesh Shah,Jonathan DeCastro,John Gideon,Beyazit Yalcinkaya,Guy Rosman,Sanjit A. Seshia
発行日 2023-03-29 20:29:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.FL, cs.LG, cs.RO パーマリンク