Distributional Drift Detection in Medical Imaging with Sketching and Fine-Tuned Transformer

要約

分布ドリフト検出は、機械学習モデルの予測結果に影響を与える可能性のある基礎となるデータ分布の変化を特定することにより、モデルの精度と信頼性を確保するのに役立つため、医療用途で重要です。
ただし、現在の方法には、ドリフトの検出に制限があります。たとえば、異常なデータセットを含めると不公平な比較につながる可能性があります。
このホワイトペーパーでは、データスケッチングと微調整技術を活用することにより、CTスキャンの医療画像の分布ドリフトを検出するための正確で敏感なアプローチを提示します。
リアルタイムの異常検出のための堅牢なベースラインライブラリモデルを開発し、着信画像の効率的な比較と異常の識別を可能にしました。
さらに、事前に訓練されたビジョントランスモデルを微調整して、マンモグラフィをケーススタディとして使用して、モデルの精度を99.11%に大幅に向上させるために、関連する機能を抽出しました。
データスケッチと微調整と組み合わせて、機能抽出評価は、同様のデータセット間のコサインの類似性スコアが約50%から99.1%に増加してより大きな改善を提供することを示しました。
最後に、感度の評価は、私たちのソリューションが1%の塩と豆類やスペックルのノイズに非常に敏感であり、照明ノイズに敏感ではないことを示しています(たとえば、照明条件はデータドリフトに影響を与えません)。
提案された方法は、動的な臨床環境で診断モデルの精度を維持するためのスケーラブルで信頼できるソリューションを提供します。

要約(オリジナル)

Distributional drift detection is important in medical applications as it helps ensure the accuracy and reliability of models by identifying changes in the underlying data distribution that could affect the prediction results of machine learning models. However, current methods have limitations in detecting drift, for example, the inclusion of abnormal datasets can lead to unfair comparisons. This paper presents an accurate and sensitive approach to detect distributional drift in CT-scan medical images by leveraging data-sketching and fine-tuning techniques. We developed a robust baseline library model for real-time anomaly detection, allowing for efficient comparison of incoming images and identification of anomalies. Additionally, we fine-tuned a pre-trained Vision Transformer model to extract relevant features, using mammography as a case study, significantly enhancing model accuracy to 99.11%. Combining with data-sketches and fine-tuning, our feature extraction evaluation demonstrated that cosine similarity scores between similar datasets provide greater improvements, from around 50% increased to 99.1%. Finally, the sensitivity evaluation shows that our solutions are highly sensitive to even 1% salt-and-pepper and speckle noise, and it is not sensitive to lighting noise (e.g., lighting conditions have no impact on data drift). The proposed methods offer a scalable and reliable solution for maintaining the accuracy of diagnostic models in dynamic clinical environments.

arxiv情報

著者 Yusen Wu,Phuong Nguyen,Rose Yesha,Yelena Yesha
発行日 2025-05-09 17:46:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV パーマリンク