要約
グループ等分散により、入力のグループ変換に対する一貫した応答が保証され、より堅牢なモデルと強化された一般化機能が実現します。
ただし、グループ内で考慮される対称性がデータで観察される対称性と異なる場合、この特性によりモデルが過度に制約される可能性があります。
一般的な方法では、データセット レベルで適切な対称レベルを決定することでこの問題に対処しますが、教師あり設定に限定されており、同じデータセット内に複数の対称レベルが共存するシナリオは無視されます。
たとえば、車と飛行機の写真は異なるレベルの回転を示していますが、両方とも CIFAR-10 データセットに含まれています。
この論文では、ラベルを必要とせずに各入力の対称性のレベルを検出できる方法を提案します。
この目的を達成するために、データ内の対称性の分布を学習するための十分かつ必要な条件を導出します。
学習した分布を使用して、自己教師ありの方法で各入力の対称性のレベルを学習できる擬似ラベルを生成します。
クラスごとに異なる対称性レベルを持つ合成データセットに対するアプローチの有効性を検証します。
MNISTMultiple。クラスに依存した間隔内で数字が均一にローテーションされます。
私たちの方法が、対称性が存在しない標準化されたデータセットの生成や、推論中の分布対称性の外れの検出などの実際的なアプリケーションに使用できることを示します。
そうすることで、非等変モデルの一般化とロバスト性の両方を向上させることができます。
私たちのコードは https://github.com/aurban0/ssl-sym で公開されています。
要約(オリジナル)
Group equivariance ensures consistent responses to group transformations of the input, leading to more robust models and enhanced generalization capabilities. However, this property can lead to overly constrained models if the symmetries considered in the group differ from those observed in data. While common methods address this by determining the appropriate level of symmetry at the dataset level, they are limited to supervised settings and ignore scenarios in which multiple levels of symmetry co-exist in the same dataset. For instance, pictures of cars and planes exhibit different levels of rotation, yet both are included in the CIFAR-10 dataset. In this paper, we propose a method able to detect the level of symmetry of each input without the need for labels. To this end, we derive a sufficient and necessary condition to learn the distribution of symmetries in the data. Using the learned distribution, we generate pseudo-labels that allow us to learn the levels of symmetry of each input in a self-supervised manner. We validate the effectiveness of our approach on synthetic datasets with different per-class levels of symmetries e.g. MNISTMultiple, in which digits are uniformly rotated within a class-dependent interval. We demonstrate that our method can be used for practical applications such as the generation of standardized datasets in which the symmetries are not present, as well as the detection of out-of-distribution symmetries during inference. By doing so, both the generalization and robustness of non-equivariant models can be improved. Our code is publicly available at https://github.com/aurban0/ssl-sym.
arxiv情報
著者 | Alonso Urbano,David W. Romero |
発行日 | 2023-12-19 15:11:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google