Shadow Datasets, New challenging datasets for Causal Representation Learning


ほとんどの因果表現学習 (CRL) 手法は完全に教師ありですが、ラベル付けにコストがかかるため現実的ではありません。
この制限を解決するために、弱く監視された CRL メソッドが導入されました。
CRL のパフォーマンスを評価するには、Pendulum、Flow、CelebA(BEARD)、CelebA(SMILE) の 4 つの既存のデータセットが利用されます。
ただし、既存の CRL データセットは、生成要素がほとんどない単純なグラフに限定されています。
そこで、より多数の多様な生成要因とより洗練された因果グラフを備えた 2 つの新しいデータセットを提案します。
さらに、現在の実際のデータセット、CelebA(BEARD) および CelebA(SMILE)、最初に提案された因果グラフは、データセットの分布と一致していません。


Discovering causal relations among semantic factors is an emergent topic in representation learning. Most causal representation learning (CRL) methods are fully supervised, which is impractical due to costly labeling. To resolve this restriction, weakly supervised CRL methods were introduced. To evaluate CRL performance, four existing datasets, Pendulum, Flow, CelebA(BEARD) and CelebA(SMILE), are utilized. However, existing CRL datasets are limited to simple graphs with few generative factors. Thus we propose two new datasets with a larger number of diverse generative factors and more sophisticated causal graphs. In addition, current real datasets, CelebA(BEARD) and CelebA(SMILE), the originally proposed causal graphs are not aligned with the dataset distributions. Thus, we propose modifications to them.


著者 Jiageng Zhu,Hanchen Xie,Jianhua Wu,Jiazhi Li,Mahyar Khayatkhoei,Mohamed E. Hussein,Wael AbdAlmageed
発行日 2023-08-10 17:14:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, cs.LG パーマリンク