CoRPA: Adversarial Image Generation for Chest X-rays Using Concept Vector Perturbations and Generative Models

要約

医療画像分類タスクのディープラーニングモデルは、AIアシストされた診断ツールで広く実装されており、診断の精度を高め、臨床医のワークロードを減らし、患者の転帰を改善することを目指しています。
しかし、敵対的な攻撃に対する彼らの脆弱性は、患者の安全に重大なリスクをもたらします。
現在の攻撃方法論は、モデルクエリやピクセル値の摂動などの一般的な手法を使用して、モデルを欺くように設計された敵対的な例を生成します。
これらのアプローチは、見逃された臨床的特徴に起因する臨床エラーのユニークな特性に適切に対処できない場合があります。
医療イメージングドメインに合わせた臨床的に焦点を当てたブラックボックス敵対的な攻撃フレームワークであるコンセプトベースのレポート摂動攻撃(CORPA)を提案します。
Corpaは臨床概念を活用して、現実的な臨床的誤診シナリオを密接に反映する敵対的な放射線報告と画像を生成します。
胸部X線と放射線レポートのMIMIC-CXR-JPGデータセットを使用して、CORPAの有用性を実証します。
私たちの評価は、Corpaの臨床的に焦点を当てた摂動にさらされると、従来の敵対的攻撃に強い回復力を示す深い学習モデルが堅牢性が著しく低いことを明らかにしています。
これは、医療AIシステムにおけるドメイン固有の脆弱性に対処することの重要性を強調しています。
専門化された敵対的攻撃フレームワークを導入することにより、この研究は、医療における堅牢で現実世界の準備ができたAIモデルを開発するための基盤を提供し、ハイステークス臨床環境での安全で信頼できる展開を確保します。

要約(オリジナル)

Deep learning models for medical image classification tasks are becoming widely implemented in AI-assisted diagnostic tools, aiming to enhance diagnostic accuracy, reduce clinician workloads, and improve patient outcomes. However, their vulnerability to adversarial attacks poses significant risks to patient safety. Current attack methodologies use general techniques such as model querying or pixel value perturbations to generate adversarial examples designed to fool a model. These approaches may not adequately address the unique characteristics of clinical errors stemming from missed or incorrectly identified clinical features. We propose the Concept-based Report Perturbation Attack (CoRPA), a clinically-focused black-box adversarial attack framework tailored to the medical imaging domain. CoRPA leverages clinical concepts to generate adversarial radiological reports and images that closely mirror realistic clinical misdiagnosis scenarios. We demonstrate the utility of CoRPA using the MIMIC-CXR-JPG dataset of chest X-rays and radiological reports. Our evaluation reveals that deep learning models exhibiting strong resilience to conventional adversarial attacks are significantly less robust when subjected to CoRPA’s clinically-focused perturbations. This underscores the importance of addressing domain-specific vulnerabilities in medical AI systems. By introducing a specialized adversarial attack framework, this study provides a foundation for developing robust, real-world-ready AI models in healthcare, ensuring their safe and reliable deployment in high-stakes clinical environments.

arxiv情報

著者 Amy Rafferty,Rishi Ramaesh,Ajitha Rajan
発行日 2025-03-28 15:34:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, eess.IV パーマリンク