Counting Fish with Temporal Representations of Sonar Video

要約

サケの脱出の正確な推定 – 上流に移動する魚の数 – は、保全と漁業管理の重要なデータです。
高解像度イメージングソナーハードウェアを使用したサーモンカウントの既存の方法は、侵襲的であり、コンピュータービジョン処理と互換性があります。
この分野での以前の作業では、自動化されたサーモンカウントのためのオブジェクトの検出と追跡ベースの方法が利用されています。
ただし、これらの手法は、フィールドでの計算と接続が限られているため、多くのソナー展開サイトにはアクセスできません。
数百フレームのイメージングソナービデオを単一の画像に圧縮する時間的表現の分析に基づいて、魚カウントのための代替の軽量コンピュータービジョン方法を提案します。
ResNet-18モデルを使用して、エコーググラムから直接200フレームの時間窓以内に上流と下流のカウントを予測し、ドメイン固有の画像増強のセットと弱く監視されたトレーニングプロトコルを提案して、結果をさらに改善します。
アラスカのケナイ川からの代表的なデータで23%のカウントエラーを達成し、アプローチの実現可能性を示しています。

要約(オリジナル)

Accurate estimates of salmon escapement – the number of fish migrating upstream to spawn – are key data for conservation and fishery management. Existing methods for salmon counting using high-resolution imaging sonar hardware are non-invasive and compatible with computer vision processing. Prior work in this area has utilized object detection and tracking based methods for automated salmon counting. However, these techniques remain inaccessible to many sonar deployment sites due to limited compute and connectivity in the field. We propose an alternative lightweight computer vision method for fish counting based on analyzing echograms – temporal representations that compress several hundred frames of imaging sonar video into a single image. We predict upstream and downstream counts within 200-frame time windows directly from echograms using a ResNet-18 model, and propose a set of domain-specific image augmentations and a weakly-supervised training protocol to further improve results. We achieve a count error of 23% on representative data from the Kenai River in Alaska, demonstrating the feasibility of our approach.

arxiv情報

著者 Kai Van Brunt,Justin Kay,Timm Haucke,Pietro Perona,Grant Van Horn,Sara Beery
発行日 2025-02-07 18:02:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク