この論文では、きめ細かい魚の分析用に設計された AutoFish という名前の新しい一般に利用可能なデータセットを紹介します。
このデータセットは、白いコンベア ベルト上にさまざまな星座に配置され、インスタンス セグメンテーション マスク、ID、および長さの測定値が注釈付けされた、視覚的に類似した魚の 454 標本の 1,500 枚の画像で構成されています。
データは、RGB カメラを使用して制御された環境で収集されました。
アノテーション手順には、手動のポイント アノテーション、Segment Anything Model (SAM) によって提案された初期セグメンテーション マスク、およびその後のマスクの手動修正が含まれます。
Mask2Former アーキテクチャの 2 つのバリエーションを使用してベースライン インスタンス セグメンテーションの結果を確立し、最もパフォーマンスの高いモデルは mAP 89.15% に達しました。
さらに、2 つのベースライン長推定方法を紹介します。最もパフォーマンスが良いのは、オクルージョンのない画像では 0.62 cm、オクルージョンのある画像では 1.38 cm の MAE に達するカスタム MobileNetV2 ベースの回帰モデルです。
プロジェクトページへのリンク: https://vap.aau.dk/autofish/。
Automated fish documentation processes are in the near future expected to play an essential role in sustainable fisheries management and for addressing challenges of overfishing. In this paper, we present a novel and publicly available dataset named AutoFish designed for fine-grained fish analysis. The dataset comprises 1,500 images of 454 specimens of visually similar fish placed in various constellations on a white conveyor belt and annotated with instance segmentation masks, IDs, and length measurements. The data was collected in a controlled environment using an RGB camera. The annotation procedure involved manual point annotations, initial segmentation masks proposed by the Segment Anything Model (SAM), and subsequent manual correction of the masks. We establish baseline instance segmentation results using two variations of the Mask2Former architecture, with the best performing model reaching an mAP of 89.15%. Additionally, we present two baseline length estimation methods, the best performing being a custom MobileNetV2-based regression model reaching an MAE of 0.62cm in images with no occlusion and 1.38cm in images with occlusion. Link to project page: https://vap.aau.dk/autofish/.
著者 | Stefan Hein Bengtson,Daniel Lehotský,Vasiliki Ismiroglou,Niels Madsen,Thomas B. Moeslund,Malte Pedersen |
発行日 | 2025-01-07 13:14:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google