要約
壊滅的な忘却は、継続学習の分野において依然として重大な課題であり、ニューラルネットワークは新しい情報を吸収しながら以前の知識を保持するのに苦労しています。
既存の研究のほとんどは、新しいタスクに遭遇した場合にのみこの問題を軽減することを強調しており、タスク前の段階の重要性を見落としています。
そこで、現在の課題学習段階に着目し、課題ごとにフラットな学習空間を事前に構築する新しいフレームワーク「C&F(Create and Find Flatness)」を提示します。
具体的には、現在のタスクの学習中に、フレームワークは損失状況の最小値の周囲に平坦な領域を適応的に作成します。
次に、平坦度に基づいて、現在のタスクに対するパラメータの重要性を見つけます。
モデルを新しいタスクに適応させるとき、平坦度に従って制約が適用され、差し迫ったタスクのために平坦な空間が同時に準備されます。
作成された平坦度と発見された平坦度の間の一貫性を理論的に実証します。
このようにして、私たちのフレームワークは、新しいタスクを学習するための十分なパラメーター空間に対応するだけでなく、以前のタスクの先行知識も保存します。
実験結果は、スタンドアロンの継続学習アプローチとしての C&F の最先端のパフォーマンスと、他の方法を組み込んだフレームワークとしてのその有効性を示しています。
私たちの成果は https://github.com/Eric8932/Create-and-Find-Flatness で入手できます。
要約(オリジナル)
Catastrophic forgetting remains a critical challenge in the field of continual learning, where neural networks struggle to retain prior knowledge while assimilating new information. Most existing studies emphasize mitigating this issue only when encountering new tasks, overlooking the significance of the pre-task phase. Therefore, we shift the attention to the current task learning stage, presenting a novel framework, C&F (Create and Find Flatness), which builds a flat training space for each task in advance. Specifically, during the learning of the current task, our framework adaptively creates a flat region around the minimum in the loss landscape. Subsequently, it finds the parameters’ importance to the current task based on their flatness degrees. When adapting the model to a new task, constraints are applied according to the flatness and a flat space is simultaneously prepared for the impending task. We theoretically demonstrate the consistency between the created and found flatness. In this manner, our framework not only accommodates ample parameter space for learning new tasks but also preserves the preceding knowledge of earlier tasks. Experimental results exhibit C&F’s state-of-the-art performance as a standalone continual learning approach and its efficacy as a framework incorporating other methods. Our work is available at https://github.com/Eric8932/Create-and-Find-Flatness.
arxiv情報
著者 | Wenhang Shi,Yiren Chen,Zhe Zhao,Wei Lu,Kimmo Yan,Xiaoyong Du |
発行日 | 2023-09-20 13:30:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google