Ensemble of ConvNeXt V2 and MaxViT for Long-Tailed CXR Classification with View-Based Aggregation

要約

この研究では、MICCAI 2024 CXR-LT チャレンジのソリューションを紹介し、サブタスク 2 で 4 位、サブタスク 1 で 5 位を獲得しました。外部の胸部 X 線データセットで事前トレーニングされた ConvNeXt V2 モデルと MaxViT モデルのアンサンブルを活用しました。
胸部所見のロングテール分布に対処するため。
提案された方法は、最先端の画像分類技術、クラスの不均衡を処理するための非対称損失、およびビューベースの予測集約を組み合わせて、分類パフォーマンスを向上させます。
実験を通じて、検出精度とCXR結果のロングテール分布の処理の両方を向上させるアプローチの利点を実証します。
コードは \url{https://github.com/yamagishi0824/cxrlt24-multiview-pp} で入手できます。

要約(オリジナル)

In this work, we present our solution for the MICCAI 2024 CXR-LT challenge, achieving 4th place in Subtask 2 and 5th in Subtask 1. We leveraged an ensemble of ConvNeXt V2 and MaxViT models, pretrained on an external chest X-ray dataset, to address the long-tailed distribution of chest findings. The proposed method combines state-of-the-art image classification techniques, asymmetric loss for handling class imbalance, and view-based prediction aggregation to enhance classification performance. Through experiments, we demonstrate the advantages of our approach in improving both detection accuracy and the handling of the long-tailed distribution in CXR findings. The code is available at \url{https://github.com/yamagishi0824/cxrlt24-multiview-pp}.

arxiv情報

著者 Yosuke Yamagishi,SHouhei Hanaoka
発行日 2024-10-14 16:49:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク