Multi-style conversion for semantic segmentation of lesions in fundus images by adversarial attacks

要約

眼底画像に依存する糖尿病性網膜症の診断は、包括的な分類アプローチを使用する場合、透明性と解釈可能性を達成するという課題に直面しています。
ただし、セグメンテーションベースのデータベースは取得コストが大幅に高く、それらを組み合わせると問題が発生することがよくあります。
この論文では、多様なデータベースにわたる注釈スタイルの標準化の欠如に対処するために、敵対的スタイル変換と呼ばれる新しい方法を紹介します。
結合されたデータベース上で単一のアーキテクチャをトレーニングすることにより、モデルは入力に応じてセグメンテーション スタイルを自発的に変更し、異なるラベル付けスタイル間で変換できることを実証します。
提案された方法論では、エンコーダーの特徴に基づいてデータセットの起源を検出するための線形プローブが追加され、モデルのセグメンテーション スタイルを条件付けるために敵対的攻撃が採用されます。
結果は、データセットの組み合わせを通じて重要な定性的および定量的であることを示し、モデルの一般化、不確実性の推定、およびアノテーション スタイル間の連続補間を改善する手段を提供します。
私たちのアプローチにより、網膜症の診断を改善するために注釈スタイルを制御および活用しながら、多様なデータベースを使用してセグメンテーション モデルをトレーニングすることが可能になります。

要約(オリジナル)

The diagnosis of diabetic retinopathy, which relies on fundus images, faces challenges in achieving transparency and interpretability when using a global classification approach. However, segmentation-based databases are significantly more expensive to acquire and combining them is often problematic. This paper introduces a novel method, termed adversarial style conversion, to address the lack of standardization in annotation styles across diverse databases. By training a single architecture on combined databases, the model spontaneously modifies its segmentation style depending on the input, demonstrating the ability to convert among different labeling styles. The proposed methodology adds a linear probe to detect dataset origin based on encoder features and employs adversarial attacks to condition the model’s segmentation style. Results indicate significant qualitative and quantitative through dataset combination, offering avenues for improved model generalization, uncertainty estimation and continuous interpolation between annotation styles. Our approach enables training a segmentation model with diverse databases while controlling and leveraging annotation styles for improved retinopathy diagnosis.

arxiv情報

著者 Clément Playout,Renaud Duval,Marie Carole Boucher,Farida Cheriet
発行日 2024-10-17 17:48:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク