Balanced Destruction-Reconstruction Dynamics for Memory-replay Class Incremental Learning

要約

クラス漸進学習(CIL)は、以前に学習した能力(安定性)を保持しながら、新しいクラスのサンプル(可塑性)で学習モデルを漸進的に更新することを目的としている。この目標における最も困難な問題、すなわち壊滅的な忘却に対処するために、主流なパラダイムは、メモリに保存された少数の古いクラスのサンプルを再生することによって古い知識を定着させるメモリ再生CILである。有効であるにもかかわらず、メモリ再生CILに内在する破壊と再構築のダイナミクスは本質的な限界である:古い知識が著しく破壊された場合、ロスレス対応部分を再構築することは非常に困難である。我々の理論的解析によれば、古い知識の破壊は、現在のフェーズからのサンプルとメモリに保存されたサンプルの寄与のバランスをとることで効果的に緩和できる。この理論的知見に動機づけられ、我々はメモリ再生CILのための新しいバランス破壊再構成モジュール(BDR)を提案する。具体的には、古い知識と新しいクラスの間のより良いバランスを達成するために、提案するBDRモジュールは2つの要因を考慮する:異なるクラス間の学習状態の分散と、現在のフェーズとメモリからのサンプルの量の不均衡。これらの要因に基づいて訓練中の勾配を動的に操作することで、BDRは知識の破壊を効果的に緩和し、知識の再構成を改善することができる。様々なCILベンチマークに対する広範な実験により、BDRは軽量なプラグアンドプレイモジュールとして、良好な汎化により既存の最先端手法の性能を大幅に改善できることが示された。

要約(オリジナル)

Class incremental learning (CIL) aims to incrementally update a trained model with the new classes of samples (plasticity) while retaining previously learned ability (stability). To address the most challenging issue in this goal, i.e., catastrophic forgetting, the mainstream paradigm is memory-replay CIL, which consolidates old knowledge by replaying a small number of old classes of samples saved in the memory. Despite effectiveness, the inherent destruction-reconstruction dynamics in memory-replay CIL are an intrinsic limitation: if the old knowledge is severely destructed, it will be quite hard to reconstruct the lossless counterpart. Our theoretical analysis shows that the destruction of old knowledge can be effectively alleviated by balancing the contribution of samples from the current phase and those saved in the memory. Motivated by this theoretical finding, we propose a novel Balanced Destruction-Reconstruction module (BDR) for memory-replay CIL, which can achieve better knowledge reconstruction by reducing the degree of maximal destruction of old knowledge. Specifically, to achieve a better balance between old knowledge and new classes, the proposed BDR module takes into account two factors: the variance in training status across different classes and the quantity imbalance of samples from the current phase and memory. By dynamically manipulating the gradient during training based on these factors, BDR can effectively alleviate knowledge destruction and improve knowledge reconstruction. Extensive experiments on a range of CIL benchmarks have shown that as a lightweight plug-and-play module, BDR can significantly improve the performance of existing state-of-the-art methods with good generalization.

arxiv情報

著者 Yuhang Zhou,Jiangchao Yao,Feng Hong,Ya Zhang,Yanfeng Wang
発行日 2023-08-03 11:33:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク