Siamese Content-based Search Engine for a More Transparent Skin and Breast Cancer Diagnosis through Histological Imaging


Computer Aid Diagnosis (CAD) は、病理学者の意思決定を支援するディープラーニング (DL) ベースのツールを備えたデジタル病理学を開発しました。
Content-Based Histopathological Image Retrieval (CBHIR) は、組織病理学的特徴の類似性の点で相関性の高いパッチを検索するための新しいツールです。
この研究では、カスタム構築された Siamese ネットワークを特徴抽出器として統合し、堅牢かつ正確なパッチレベルの検索を実現するために、乳房 (双子の乳房) と皮膚がん (皮膚の双子) のデータセットに対する 2 つの CBHIR アプローチを提案しました。
提案されたシャム ネットワークは、入力ペアの同様の組織病理学的特徴に焦点を当てることで、目に見えない画像を一般化できます。
提案された CBHIR アプローチは、乳房 (公開) および皮膚 (非公開) データセットでトップ K の精度で評価されます。
K の最適な量を見つけるのは困難ですが、K が増加するほど、クエリと返された画像の間の非類似性が増加し、病理学者を誤解させる可能性があります。
Breast-twins モデルは、最初に F1 スコアの 70% を達成し、5 や 400 などのより高い量の K で他の最先端の方法を上回ります。 Skin-twins は、最近提案された畳み込み自動エンコーダを上回ります。
(CAE) が 67% 向上し、精度が向上します。
さらに、Skin-twins モデルは、悪性の可能性が不明なスピッツイド腫瘍 (STUMP) の課題に取り組み、病理学者がトップ K の画像とそれに対応するラベルを取得できるように支援します。
したがって、このアプローチは、透明性、信頼性、信頼性などの点で、病理学者にとってより説明しやすい CAD ツールを提供できます。


Computer Aid Diagnosis (CAD) has developed digital pathology with Deep Learning (DL)-based tools to assist pathologists in decision-making. Content-Based Histopathological Image Retrieval (CBHIR) is a novel tool to seek highly correlated patches in terms of similarity in histopathological features. In this work, we proposed two CBHIR approaches on breast (Breast-twins) and skin cancer (Skin-twins) data sets for robust and accurate patch-level retrieval, integrating a custom-built Siamese network as a feature extractor. The proposed Siamese network is able to generalize for unseen images by focusing on the similar histopathological features of the input pairs. The proposed CBHIR approaches are evaluated on the Breast (public) and Skin (private) data sets with top K accuracy. Finding the optimum amount of K is challenging, but also, as much as K increases, the dissimilarity between the query and the returned images increases which might mislead the pathologists. To the best of the author’s belief, this paper is tackling this issue for the first time on histopathological images by evaluating the top first retrieved images. The Breast-twins model achieves 70% of the F1score at the top first, which exceeds the other state-of-the-art methods at a higher amount of K such as 5 and 400. Skin-twins overpasses the recently proposed Convolutional Auto Encoder (CAE) by 67%, increasing the precision. Besides, the Skin-twins model tackles the challenges of Spitzoid Tumors of Uncertain Malignant Potential (STUMP) to assist pathologists with retrieving top K images and their corresponding labels. So, this approach can offer a more explainable CAD tool to pathologists in terms of transparency, trustworthiness, or reliability among other characteristics.


著者 Zahra Tabatabaei,Adrián Colomer,JAvier Oliver Moll,Valery Naranjo
発行日 2024-01-16 10:51:55+00:00
arxivサイト arxiv_id(pdf)

カテゴリー: cs.CV, cs.IR, cs.LG パーマリンク