Information Flow in Self-Supervised Learning


このペーパーでは、行列情報理論のレンズを通して自己教師あり学習 (SSL) 手法を理解し、強化するための包括的なツールボックスを提供します。
さらに、マスク画像モデリングの強化として、行列情報理論に基づいた行列変分マスク自動エンコーダ (M-MAE) 法を提案します。
実証的な評価では、最先端の手法と比較した M-MAE の有効性が強調されており、いずれも ImageNet 上で線形プローブ ViT-Base で 3.9% の改善、ViT-Large の微調整で 1% の改善が見られました。


In this paper, we provide a comprehensive toolbox for understanding and enhancing self-supervised learning (SSL) methods through the lens of matrix information theory. Specifically, by leveraging the principles of matrix mutual information and joint entropy, we offer a unified analysis for both contrastive and feature decorrelation based methods. Furthermore, we propose the matrix variational masked auto-encoder (M-MAE) method, grounded in matrix information theory, as an enhancement to masked image modeling. The empirical evaluations underscore the effectiveness of M-MAE compared with the state-of-the-art methods, including a 3.9% improvement in linear probing ViT-Base, and a 1% improvement in fine-tuning ViT-Large, both on ImageNet.


著者 Zhiquan Tan,Jingqin Yang,Weiran Huang,Yang Yuan,Yifan Zhang
発行日 2023-09-29 14:32:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV パーマリンク