ProMi: An Efficient Prototype-Mixture Baseline for Few-Shot Segmentation with Bounding-Box Annotations

要約

ロボット工学アプリケーションでは、ロボットが最小限のトレーニングデータで複雑なタスクを実行し、多様で現実世界の環境への適応を促進できるため、少数のショットセグメンテーションが重要です。
ただし、少量の画像のピクセルレベルの注釈は、非常に時間がかかり、費用がかかります。
このホワイトペーパーでは、ピクセルレベルのラベルの代わりに、境界ボックスアノテーションに基づいて、新しいいくつかのショットバイナリセグメンテーション法を紹介します。
バックグラウンドクラスを分布の混合として扱う効率的​​なプロトタイプミックスベースの方法を紹介します。
私たちのアプローチは、シンプルで、トレーニングがなく、効果的で、粗い注釈が簡単に対応しています。
既存のベースラインと比較して、PROMIは大きな利益をもたらすさまざまなデータセットで最高の結果を達成し、その有効性を示しています。
さらに、現実世界のモバイルロボットタスクに合わせた定性的実験を提示し、そのようなシナリオでのアプローチの適用性を実証します。
私たちのコード:https://github.com/thalesgroup/promi。

要約(オリジナル)

In robotics applications, few-shot segmentation is crucial because it allows robots to perform complex tasks with minimal training data, facilitating their adaptation to diverse, real-world environments. However, pixel-level annotations of even small amount of images is highly time-consuming and costly. In this paper, we present a novel few-shot binary segmentation method based on bounding-box annotations instead of pixel-level labels. We introduce, ProMi, an efficient prototype-mixture-based method that treats the background class as a mixture of distributions. Our approach is simple, training-free, and effective, accommodating coarse annotations with ease. Compared to existing baselines, ProMi achieves the best results across different datasets with significant gains, demonstrating its effectiveness. Furthermore, we present qualitative experiments tailored to real-world mobile robot tasks, demonstrating the applicability of our approach in such scenarios. Our code: https://github.com/ThalesGroup/promi.

arxiv情報

著者 Florent Chiaroni,Ali Ayub,Ola Ahmad
発行日 2025-05-18 21:08:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク