Exploring AI-based System Design for Pixel-level Protected Health Information Detection in Medical Images


このプロセスの最初のステップには、画像メタデータ内にある、または画像ピクセル内に刻印されている保護医療情報 (PHI) の検出が含まれます。
このようなシステムの重要性にもかかわらず、既存の AI ベースのソリューションの評価は限られており、信頼性が高く堅牢なツールの開発に障壁が生じています。
この研究では、テキスト検出、テキスト抽出、医療画像内の PHI コンテンツの分析という 3 つの主要なコンポーネントで構成される、PHI 検出用の AI ベースのパイプラインを紹介します。
パイプライン内で視覚モデルと言語モデルの役割を交換する実験を行うことで、パフォーマンスを評価し、PHI 検出タスクに最適なセットアップを推奨します。


De-identification of medical images is a critical step to ensure privacy during data sharing in research and clinical settings. The initial step in this process involves detecting Protected Health Information (PHI), which can be found in image metadata or imprinted within image pixels. Despite the importance of such systems, there has been limited evaluation of existing AI-based solutions, creating barriers to the development of reliable and robust tools. In this study, we present an AI-based pipeline for PHI detection, comprising three key components: text detection, text extraction, and analysis of PHI content in medical images. By experimenting with exchanging roles of vision and language models within the pipeline, we evaluate the performance and recommend the best setup for the PHI detection task.


著者 Tuan Truong,Ivo M. Baltruschat,Mark Klemens,Grit Werner,Matthias Lenga
発行日 2025-01-16 14:12:33+00:00
