Domain-Agnostic Neural Architecture for Class Incremental Continual Learning in Document Processing Platform


複雑なシステムにおける運用環境のデプロイメントでは、ML アーキテクチャが効率性が高く、複数のタスクに対して使用できることが必要です。
確率的勾配学習を使用した最近の手法は、そのような設定では困難であるか、メモリ バッファーなどの制限があり、特定のドメインに制限されているために現実世界のシナリオでは使用できないことがわかっています。
提案された手法はメモリ バッファなしで SOTA の結果を達成し、明らかに参照手法よりも優れています。


Production deployments in complex systems require ML architectures to be highly efficient and usable against multiple tasks. Particularly demanding are classification problems in which data arrives in a streaming fashion and each class is presented separately. Recent methods with stochastic gradient learning have been shown to struggle in such setups or have limitations like memory buffers, and being restricted to specific domains that disable its usage in real-world scenarios. For this reason, we present a fully differentiable architecture based on the Mixture of Experts model, that enables the training of high-performance classifiers when examples from each class are presented separately. We conducted exhaustive experiments that proved its applicability in various domains and ability to learn online in production environments. The proposed technique achieves SOTA results without a memory buffer and clearly outperforms the reference methods.


著者 Mateusz Wójcik,Witold Kościukiewicz,Mateusz Baran,Tomasz Kajdanowicz,Adam Gonczarek
発行日 2023-07-11 16:01:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.LG パーマリンク