CASCRNet: An Atrous Spatial Pyramid Pooling and Shared Channel Residual based Network for Capsule Endoscopy

要約

この原稿は、MISAHUB による Capsule Vision Challenge 2024 の取り組みを要約したものです。
カプセル ビジョン チャレンジ データセットの複雑さと不均衡により困難な複数クラスの疾患分類タスクに対処するために、この論文では、以下を使用するパラメーター効率の高い新しいモデル CASCRNet (カプセル内視鏡-Aspp-SCR-ネットワーク) を提案します。
Shared Channel Residual (SCR) ブロックと Atrous Spatial Pyramid Pooling (ASPP) ブロック。
さらに、提案されたモデルのパフォーマンスが他のよく知られたアプローチと比較されます。
実験結果から、提案されたモデルがより優れた疾患分類結果を提供することがわかりました。
提案されたモデルは、F1 スコア 78.5%、平均 AUC 98.3% で疾患を分類することに成功しました。これは、そのコンパクトなアーキテクチャを考慮すると有望です。

要約(オリジナル)

This manuscript summarizes work on the Capsule Vision Challenge 2024 by MISAHUB. To address the multi-class disease classification task, which is challenging due to the complexity and imbalance in the Capsule Vision challenge dataset, this paper proposes CASCRNet (Capsule endoscopy-Aspp-SCR-Network), a parameter-efficient and novel model that uses Shared Channel Residual (SCR) blocks and Atrous Spatial Pyramid Pooling (ASPP) blocks. Further, the performance of the proposed model is compared with other well-known approaches. The experimental results yield that proposed model provides better disease classification results. The proposed model was successful in classifying diseases with an F1 Score of 78.5% and a Mean AUC of 98.3%, which is promising given its compact architecture.

arxiv情報

著者 K V Srinanda,M Manvith Prabhu,Shyam Lal
発行日 2024-10-23 13:35:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク