A Surrogate Model Framework for Explainable Autonomous Behaviour


この作業では、サロゲート モデルを使用して、動作のアクティベーションの基礎となるポリシーに関する透明性を提供します。
これらのサロゲート モデルが、自律エージェントの動作を自然言語説明で使用するための説明可能なコンポーネントに効果的に分解できることを示します。


Adoption and deployment of robotic and autonomous systems in industry are currently hindered by the lack of transparency, required for safety and accountability. Methods for providing explanations are needed that are agnostic to the underlying autonomous system and easily updated. Furthermore, different stakeholders with varying levels of expertise, will require different levels of information. In this work, we use surrogate models to provide transparency as to the underlying policies for behaviour activation. We show that these surrogate models can effectively break down autonomous agents’ behaviour into explainable components for use in natural language explanations.


著者 Konstantinos Gavriilidis,Andrea Munafo,Wei Pang,Helen Hastie
発行日 2023-05-31 10:31:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク