LifeLonger: A Benchmark for Continual Disease Classification

要約

深層学習モデルは、医用画像の所見の認識に大きな効果を示しています。
ただし、絶えず変化する臨床環境を処理することはできず、さまざまなソースから新たに注釈が付けられた医療データをもたらします。
データの着信ストリームを活用するために、これらのモデルは、以前に取得した知識を忘れることなく、新しいサンプルから順次学習することで大きなメリットが得られます。
この論文では、既存の最先端の継続的学習方法を適用することにより、MedMNISTコレクションの継続的疾患分類のベンチマークであるLifeLongerを紹介します。
特に、3つの継続的な学習シナリオ、つまり、タスクとクラスの増分学習と、新しく定義されたクロスドメイン増分学習を検討します。
疾患のタスクおよびクラスの増分学習は、モデルを最初から再トレーニングせずに新しいサンプルを分類する問題に対処し、クロスドメインの増分学習は、以前に取得した知識を保持しながら、さまざまな機関から発信されたデータセットを処理する問題に対処します。
パフォーマンスの徹底的な分析を実行し、壊滅的な忘却などの継続的な学習のよく知られた課題がこの設定でどのように現れるかを調べます。
有望な結果は、継続的な学習が疾患分類を前進させ、臨床現場のためのより堅牢で効率的な学習フレームワークを生み出す大きな可能性を秘めていることを示しています。
完全なベンチマークのコードリポジトリ、データパーティション、およびベースラインの結果が公開されます。

要約(オリジナル)

Deep learning models have shown a great effectiveness in recognition of findings in medical images. However, they cannot handle the ever-changing clinical environment, bringing newly annotated medical data from different sources. To exploit the incoming streams of data, these models would benefit largely from sequentially learning from new samples, without forgetting the previously obtained knowledge. In this paper we introduce LifeLonger, a benchmark for continual disease classification on the MedMNIST collection, by applying existing state-of-the-art continual learning methods. In particular, we consider three continual learning scenarios, namely, task and class incremental learning and the newly defined cross-domain incremental learning. Task and class incremental learning of diseases address the issue of classifying new samples without re-training the models from scratch, while cross-domain incremental learning addresses the issue of dealing with datasets originating from different institutions while retaining the previously obtained knowledge. We perform a thorough analysis of the performance and examine how the well-known challenges of continual learning, such as the catastrophic forgetting exhibit themselves in this setting. The encouraging results demonstrate that continual learning has a major potential to advance disease classification and to produce a more robust and efficient learning framework for clinical settings. The code repository, data partitions and baseline results for the complete benchmark will be made publicly available.

arxiv情報

著者 Mohammad Mahdi Derakhshani,Ivona Najdenkoska,Tom van Sonsbeek,Xiantong Zhen,Dwarikanath Mahapatra,Marcel Worring,Cees G. M. Snoek
発行日 2022-06-30 11:45:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T07, cs.CV パーマリンク