Robust Asymmetric Loss for Multi-Label Long-Tailed Learning

要約

実際の医療データでは、トレーニング サンプルは通常、複数のラベルを持つロングテール分布を示します。
医療データのクラス分布は長い尾状になっており、さまざまな疾患の発生率が非常に多様であると同時に、症状のある患者から撮影された画像が複数のラベルの疾患であることも珍しくありません。
したがって、この論文では、多項式関数の堅牢な非対称損失を提示することにより、これら 2 つの問題に同時に対処します。
私たちの損失はロングテール分類問題とマルチラベル分類問題の両方に同時に取り組むため、多数のハイパーパラメーターを含む複雑な損失関数の設計が必要になります。
多数のハイパーパラメータがあるためモデルは高度に微調整できますが、すべてのハイパーパラメータを同時に最適化することは難しく、モデルが過剰適合するリスクがある可能性があります。
したがって、ヒル損失アプローチを使用して損失関数を正規化します。これは、モデルの過学習のリスクを軽減するために、多数のハイパーパラメーターに対する感度が低くなるという利点があります。
このため、提案された損失は、ほとんどの医療画像分類タスクに適用できる一般的な方法であり、トレーニング プロセスに時間がかかることはありません。
提案されたロバストな非対称損失が、さまざまなロングテール単一ラベル データセットに加えて、マルチラベル医用画像分類に対して有利に機能することを示します。
特に、私たちの手法は、ICCV CVAMD 2023 コンペティションの CXR-LT データセットでトップ 5 の結果を達成しました。
堅牢な非対称損失の実装は、パブリック リポジトリ https://github.com/kalelpark/RAL でオープンソース化されています。

要約(オリジナル)

In real medical data, training samples typically show long-tailed distributions with multiple labels. Class distribution of the medical data has a long-tailed shape, in which the incidence of different diseases is quite varied, and at the same time, it is not unusual for images taken from symptomatic patients to be multi-label diseases. Therefore, in this paper, we concurrently address these two issues by putting forth a robust asymmetric loss on the polynomial function. Since our loss tackles both long-tailed and multi-label classification problems simultaneously, it leads to a complex design of the loss function with a large number of hyper-parameters. Although a model can be highly fine-tuned due to a large number of hyper-parameters, it is difficult to optimize all hyper-parameters at the same time, and there might be a risk of overfitting a model. Therefore, we regularize the loss function using the Hill loss approach, which is beneficial to be less sensitive against the numerous hyper-parameters so that it reduces the risk of overfitting the model. For this reason, the proposed loss is a generic method that can be applied to most medical image classification tasks and does not make the training process more time-consuming. We demonstrate that the proposed robust asymmetric loss performs favorably against the long-tailed with multi-label medical image classification in addition to the various long-tailed single-label datasets. Notably, our method achieves Top-5 results on the CXR-LT dataset of the ICCV CVAMD 2023 competition. We opensource our implementation of the robust asymmetric loss in the public repository: https://github.com/kalelpark/RAL.

arxiv情報

著者 Wongi Park,Inhyuk Park,Sungeun Kim,Jongbin Ryu
発行日 2023-08-10 12:41:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク