CAVE-Net: Classifying Abnormalities in Video Capsule Endoscopy

要約

医療画像の正確な分類は、誤分類が患者の転帰に大きな影響を与える可能性がある消化管の異常を検出するために非常に重要です。
複雑な画像データセットを分析する際の診断精度を向上させるために、アンサンブルベースのアプローチを提案します。
畳み込みブロック アテンション モジュールとディープ ニューラル ネットワークを併用することで、各モデルの独自の特徴抽出機能を活用して全体的な精度を向上させます。
提案されたアンサンブルの予測力をさらに多様化するために、ランダム フォレスト、XGBoost、サポート ベクター マシン、K 最近傍などの分類モデルが導入されています。
これらの方法を使用することにより、提案されたフレームワークである CAVE-Net は、堅牢な特徴識別と改善された分類結果を提供します。
実験による評価では、CAVE-Net が困難で不均衡なクラス全体にわたって高い精度と堅牢性を実現し、コンピューター ビジョン タスクにおけるより広範なアプリケーションに大きな期待を寄せていることが実証されています。

要約(オリジナル)

Accurate classification of medical images is critical for detecting abnormalities in the gastrointestinal tract, a domain where misclassification can significantly impact patient outcomes. We propose an ensemble-based approach to improve diagnostic accuracy in analyzing complex image datasets. Using a Convolutional Block Attention Module along with a Deep Neural Network, we leverage the unique feature extraction capabilities of each model to enhance the overall accuracy. The classification models, such as Random Forest, XGBoost, Support Vector Machine and K-Nearest Neighbors are introduced to further diversify the predictive power of proposed ensemble. By using these methods, the proposed framework, CAVE-Net, provides robust feature discrimination and improved classification results. Experimental evaluations demonstrate that the CAVE-Net achieves high accuracy and robustness across challenging and imbalanced classes, showing significant promise for broader applications in computer vision tasks.

arxiv情報

著者 Ishita Harish,Saurav Mishra,Neha Bhadoria,Rithik Kumar,Madhav Arora,Syed Rameem Zahra,Ankur Gupta
発行日 2024-12-30 12:48:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク