ProtoSAM – One Shot Medical Image Segmentation With Foundational Models

要約

この研究では、ワンショット医療画像セグメンテーションのための新しいフレームワークである ProtoSAM を導入しています。
これは、少数ショット セグメンテーションで知られるプロトタイプ ネットワークの使用と、自然画像基盤モデルである SAM を組み合わせたものです。
提案された方法では、DINOv2 エンコーダで強化された ALPnet プロトタイプ ネットワークを使用して、初期の粗セグメンテーション マスクを作成します。
初期マスクの抽出に続いて、点や境界ボックスなどのプロンプトが抽出され、これらがセグメント何でもモデル (SAM) に入力されます。
最先端の結果がいくつかの医用画像データセットで表示され、基礎モデルを微調整する必要なく、単一の画像例 (ワンショット) を使用して自動セグメンテーション機能を実証します。

要約(オリジナル)

This work introduces a new framework, ProtoSAM, for one-shot medical image segmentation. It combines the use of prototypical networks, known for few-shot segmentation, with SAM – a natural image foundation model. The method proposed creates an initial coarse segmentation mask using the ALPnet prototypical network, augmented with a DINOv2 encoder. Following the extraction of an initial mask, prompts are extracted, such as points and bounding boxes, which are then input into the Segment Anything Model (SAM). State-of-the-art results are shown on several medical image datasets and demonstrate automated segmentation capabilities using a single image example (one shot) with no need for fine-tuning of the foundation model.

arxiv情報

著者 Lev Ayzenberg,Raja Giryes,Hayit Greenspan
発行日 2024-07-09 17:04:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク