A metric learning approach for endoscopic kidney stone identification

要約

最近、尿管鏡検査中に腎臓結石を自動識別し、迅速な治療決定を可能にするいくつかの深層学習 (DL) 手法が提案されています。
これらの DL アプローチが有望な結果につながったとしても、それらは主に、多数のラベル付きデータが利用可能な腎臓結石タイプに適しています。
ただし、一部のまれな腎臓結石の種類については、ラベル付きの画像がほとんど利用できません。
この貢献は、ディープ メトリック ラーニング (DML) メソッドを活用して、i) 少数のサンプルでこのようなクラスを処理し、ii) 配布サンプルから十分に一般化し、iii) データベースに追加される新しいクラスに適切に対処します。
提案されているガイド付きディープメトリクス学習アプローチは、改良された方法でデータ表現を学習するように設計された新しいアーキテクチャに基づいています。
このソリューションは、Few-Shot Learning (FSL) からインスピレーションを得たもので、教師と生徒のアプローチを利用しています。
教師モデル (GEMINI) は、ラベル付きデータからの事前知識に基づいて縮小仮説空間を生成し、知識蒸留スキームを通じて学生モデル (つまり、ResNet50) へのガイドとして使用されます。
まず、認識に別々に使用される 2 つのデータセット、つまり腎臓結石の破片の表面について取得された画像のセットと、破片部分の画像のセットに対して広範なテストが実行されました。
提案された DML アプローチは、DL 手法および他の DML アプローチと比較して、識別精度をそれぞれ 10% および 12% 向上させました。
さらに、2 つのデータセット タイプからのモデルの埋め込みが、マルチビュー スキームを通じて組織的な方法で結合され、表面と断面の断片の情報が同時に活用されました。
結果の混合モデルを使用したテストにより、DL モデルと浅い機械学習手法に関してそれぞれ識別精度が少なくとも 3%、最大 30% 向上します。

要約(オリジナル)

Several Deep Learning (DL) methods have recently been proposed for an automated identification of kidney stones during an ureteroscopy to enable rapid therapeutic decisions. Even if these DL approaches led to promising results, they are mainly appropriate for kidney stone types for which numerous labelled data are available. However, only few labelled images are available for some rare kidney stone types. This contribution exploits Deep Metric Learning (DML) methods i) to handle such classes with few samples, ii) to generalize well to out of distribution samples, and iii) to cope better with new classes which are added to the database. The proposed Guided Deep Metric Learning approach is based on a novel architecture which was designed to learn data representations in an improved way. The solution was inspired by Few-Shot Learning (FSL) and makes use of a teacher-student approach. The teacher model (GEMINI) generates a reduced hypothesis space based on prior knowledge from the labeled data, and is used it as a guide to a student model (i.e., ResNet50) through a Knowledge Distillation scheme. Extensive tests were first performed on two datasets separately used for the recognition, namely a set of images acquired for the surfaces of the kidney stone fragments, and a set of images of the fragment sections. The proposed DML-approach improved the identification accuracy by 10% and 12% in comparison to DL-methods and other DML-approaches, respectively. Moreover, model embeddings from the two dataset types were merged in an organized way through a multi-view scheme to simultaneously exploit the information of surface and section fragments. Test with the resulting mixed model improves the identification accuracy by at least 3% and up to 30% with respect to DL-models and shallow machine learning methods, respectively.

arxiv情報

著者 Jorge Gonzalez-Zapata,Francisco Lopez-Tiro,Elias Villalvazo-Avila,Daniel Flores-Araiza,Jacques Hubert,Andres Mendez-Vazquez,Gilberto Ochoa-Ruiz,Christian Daul
発行日 2023-07-13 20:02:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク