Disentangled Representation Learning


もつれの解けた表現学習 (DRL) は、表現形式で観察可能なデータに隠された根本的な要因を特定し、もつれを解くことができるモデルを学習することを目的としています。
一般的な学習戦略として、DRL は、コンピューター ビジョン、自然言語処理、データ マイニングなどの幅広いシナリオで、モデルの説明可能性、制御可能性、堅牢性、および汎化能力を向上させる能力を実証しています。この記事では、
動機、定義、方法論、評価、アプリケーション、モデル設計などのさまざまな側面から DRL を包括的にレビューします。
私たちは、よく知られている 2 つの定義、つまり直観的な定義と群理論の定義に基づいて DRL に関する研究について説明します。
さらに、DRL の方法論を 4 つのグループ、つまり、従来の統計的アプローチ、変分自動エンコーダー ベースのアプローチ、敵対的生成ネットワーク ベースのアプローチ、階層的アプローチ、およびその他のアプローチに分類します。
また、実際のアプリケーションでさまざまなタスクに利益をもたらすさまざまな DRL モデルを設計するための原理も分析します。
最後に、DRL における課題と、将来の調査に値する潜在的な研究の方向性を指摘します。
私たちは、この研究がコミュニティでの DRL 研究を促進するための洞察を提供する可能性があると信じています。


Disentangled Representation Learning (DRL) aims to learn a model capable of identifying and disentangling the underlying factors hidden in the observable data in representation form. The process of separating underlying factors of variation into variables with semantic meaning benefits in learning explainable representations of data, which imitates the meaningful understanding process of humans when observing an object or relation. As a general learning strategy, DRL has demonstrated its power in improving the model explainability, controlability, robustness, as well as generalization capacity in a wide range of scenarios such as computer vision, natural language processing, data mining etc. In this article, we comprehensively review DRL from various aspects including motivations, definitions, methodologies, evaluations, applications and model designs. We discuss works on DRL based on two well-recognized definitions, i.e., Intuitive Definition and Group Theory Definition. We further categorize the methodologies for DRL into four groups, i.e., Traditional Statistical Approaches, Variational Auto-encoder Based Approaches, Generative Adversarial Networks Based Approaches, Hierarchical Approaches and Other Approaches. We also analyze principles to design different DRL models that may benefit different tasks in practical applications. Finally, we point out challenges in DRL as well as potential research directions deserving future investigations. We believe this work may provide insights for promoting the DRL research in the community.


著者 Xin Wang,Hong Chen,Si’ao Tang,Zihao Wu,Wenwu Zhu
発行日 2023-08-16 16:05:00+00:00
