要約
深層学習モデルは、新しいタスクを段階的に学習するときに壊滅的な忘却に悩まされます。
新しいクラスを識別することを学びながら、古いクラスの知識を保持するために、インクリメンタル学習が提案されています。
典型的なアプローチは、古い知識を忘れないように、いくつかの模範を使用することです。
このようなシナリオでは、古いクラスと新しいクラスの間のデータの不均衡が、モデルのパフォーマンスの低下につながる重要な問題です。
データの不均衡による新しいクラスへのバイアスを修正するために、いくつかの戦略が設計されています。
ただし、それらは古いクラスと新しいクラスの間のバイアス関係の仮定に大きく依存しています。
したがって、これらは複雑な実世界のアプリケーションには適していません。
この研究では、この問題に対処するために、仮定にとらわれない方法であるMulti-Granularity Regularized re-Balancing(MGRB)を提案します。
リバランス方法は、データの不均衡の影響を軽減するために使用されます。
ただし、経験的に、それらが新しいクラスに適合しないことを発見しました。
この目的のために、データの再バランスに加えて、モデルがクラスの相関を考慮することを可能にする、新しいマルチ粒度正則化項をさらに設計します。
クラス階層は、最初に、意味的または視覚的に類似したクラスをグループ化することによって構築されます。
次に、複数粒度の正則化により、ワンホットラベルベクトルが連続ラベル分布に変換されます。これは、構築されたクラス階層に基づいて、ターゲットクラスと他のクラスの間の関係を反映します。
したがって、モデルはクラス間の関係情報を学習でき、古いクラスと新しいクラスの両方の学習を強化するのに役立ちます。
公開データセットと実際の障害診断データセットの両方での実験結果は、提案された方法の有効性を検証します。
要約(オリジナル)
Deep learning models suffer from catastrophic forgetting when learning new tasks incrementally. Incremental learning has been proposed to retain the knowledge of old classes while learning to identify new classes. A typical approach is to use a few exemplars to avoid forgetting old knowledge. In such a scenario, data imbalance between old and new classes is a key issue that leads to performance degradation of the model. Several strategies have been designed to rectify the bias towards the new classes due to data imbalance. However, they heavily rely on the assumptions of the bias relation between old and new classes. Therefore, they are not suitable for complex real-world applications. In this study, we propose an assumption-agnostic method, Multi-Granularity Regularized re-Balancing (MGRB), to address this problem. Re-balancing methods are used to alleviate the influence of data imbalance; however, we empirically discover that they would under-fit new classes. To this end, we further design a novel multi-granularity regularization term that enables the model to consider the correlations of classes in addition to re-balancing the data. A class hierarchy is first constructed by grouping the semantically or visually similar classes. The multi-granularity regularization then transforms the one-hot label vector into a continuous label distribution, which reflects the relations between the target class and other classes based on the constructed class hierarchy. Thus, the model can learn the inter-class relational information, which helps enhance the learning of both old and new classes. Experimental results on both public datasets and a real-world fault diagnosis dataset verify the effectiveness of the proposed method.
arxiv情報
著者 | Huitong Chen,Yu Wang,Qinghua Hu |
発行日 | 2022-06-30 11:04:51+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google