DAPlankton: Benchmark Dataset for Multi-instrument Plankton Recognition via Fine-grained Domain Adaptation

要約

プランクトンの認識は、ドメイン適応 (DA) 手法を開発するためのさまざまな環境側面と興味深い現実世界の状況を研究するための新たな可能性を提供します。
イメージング機器が異なるとデータセット間でドメインシフトが発生し、一般的なプランクトン認識方法の開発が妨げられます。
これに対する有望な解決策は、ある機器でトレーニングされたモデルを他の機器に適応できるようにする DA です。
この論文では、さまざまな機器で取得された植物プランクトン画像から構成される、DAPlankton と呼ばれる新しい DA データセットを紹介します。
植物プランクトンは、タスクの粒度が細かい性質と現実世界のデータセットにおけるクラスの不均衡により、困難な DA 問題を引き起こします。
DAPlankton は 2 つのサブセットで構成されます。
DAPlankton_LAB には、ラベルの不確実性が最小限に抑えられたバランスの取れたデータセットを提供する培養植物プランクトンの画像が含まれています。
DAPlankton_SEA はバルト海から収集された画像で構成されており、クラス内分散とクラス不均衡が大きい、困難な現実世界のデータを提供します。
さらに、広く使用されている 3 つの DA 手法のベンチマーク比較を示します。

要約(オリジナル)

Plankton recognition provides novel possibilities to study various environmental aspects and an interesting real-world context to develop domain adaptation (DA) methods. Different imaging instruments cause domain shift between datasets hampering the development of general plankton recognition methods. A promising remedy for this is DA allowing to adapt a model trained on one instrument to other instruments. In this paper, we present a new DA dataset called DAPlankton which consists of phytoplankton images obtained with different instruments. Phytoplankton provides a challenging DA problem due to the fine-grained nature of the task and high class imbalance in real-world datasets. DAPlankton consists of two subsets. DAPlankton_LAB contains images of cultured phytoplankton providing a balanced dataset with minimal label uncertainty. DAPlankton_SEA consists of images collected from the Baltic Sea providing challenging real-world data with large intra-class variance and class imbalance. We further present a benchmark comparison of three widely used DA methods.

arxiv情報

著者 Daniel Batrakhanov,Tuomas Eerola,Kaisa Kraft,Lumi Haraguchi,Lasse Lensu,Sanna Suikkanen,María Teresa Camarena-Gómez,Jukka Seppälä,Heikki Kälviäinen
発行日 2024-02-08 12:18:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク