Disentangled (Un)Controllable Features

要約

高次元の状態を持つMDPの文脈では、下流タスクは元の入力空間の圧縮された低次元の表現に適用されることが主流である。そのため、有用な表現を得るために様々な学習目標が用いられてきた。しかし、これらの表現は通常、異なる特徴の解釈可能性に欠けている。本論文では、潜在的特徴を制御可能な分割と制御不可能な分割に分離することができる新しいアプローチを提案する。得られた分割された表現が、3種類の環境において容易に解釈可能であることを示し、手続き的に生成された迷路環境の分布において、分離された制御可能な潜在的分割において、解釈可能に計画アルゴリズムを採用することが可能であることを示す。

要約(オリジナル)

In the context of MDPs with high-dimensional states, downstream tasks are predominantly applied on a compressed, low-dimensional representation of the original input space. A variety of learning objectives have therefore been used to attain useful representations. However, these representations usually lack interpretability of the different features. We present a novel approach that is able to disentangle latent features into a controllable and an uncontrollable partition. We illustrate that the resulting partitioned representations are easily interpretable on three types of environments and show that, in a distribution of procedurally generated maze environments, it is feasible to interpretably employ a planning algorithm in the isolated controllable latent partition.

arxiv情報

著者 Jacob E. Kooi,Mark Hoogendoorn,Vincent François-Lavet
発行日 2024-01-03 14:20:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG パーマリンク