Deep learning-based ecological analysis of camera trap images is impacted by training data quality and size

要約

カメラトラップから収集した大規模な野生動物の画像コレクションは、生物多様性のモニタリングに不可欠であり、種の豊富さ、占有率、活動パターンについての洞察を提供します。
ただし、これらのデータを手動で処理するには時間がかかり、分析プロセスが妨げられます。
これに対処するために、画像分析を自動化するためにディープ ニューラル ネットワークが広く採用されています。
使用が増加しているにもかかわらず、モデルトレーニングの決定が下流の生態学的指標に及ぼす影響は依然として不明瞭です。
ここでは、アフリカのサバンナとアジアの亜熱帯乾燥林からのカメラ トラップ データを分析し、専門家が生成した種の同定から導き出された主要な生態学的指標とディープ ニューラル ネットワークから生成された指標を比較します。
モデルのアーキテクチャ、トレーニング データのノイズ、データセット サイズが、種の豊富さ、占有率、活動パターンなどの生態学的指標に及ぼす影響を評価します。
私たちの結果は、モデル アーキテクチャの影響は最小限であるものの、大量のノイズとデータセット サイズの縮小がこれらの指標に大きな影響を与えることを示しています。
それにもかかわらず、推定された生態学的指標はかなりのノイズに対して耐性があり、種ラベルの最大 10% の誤差やトレーニング セット サイズの 50% 削減を大幅に変更することなく許容します。
また、分類誤差などの従来の指標は、生態学的指標を正確に測定するモデルの能力を必ずしも表すとは限らないことも強調します。
私たちは、ディープ ニューラル ネットワークの予測から導出された生態学的メトリクスは、専門家のラベルから計算されたものと厳密に一致しており、調査された要因の変動に対して頑強であると結論付けています。
ただし、ディープ ニューラル ネットワークのトレーニングに関する決定は、下流の生態分析に影響を与える可能性があります。
したがって、実践者は大規模でクリーンなトレーニング セットの作成を優先し、関心のある生態学的指標を測定する能力に基づいてディープ ニューラル ネットワーク ソリューションを評価する必要があります。

要約(オリジナル)

Large wildlife image collections from camera traps are crucial for biodiversity monitoring, offering insights into species richness, occupancy, and activity patterns. However, manual processing of these data is time-consuming, hindering analytical processes. To address this, deep neural networks have been widely adopted to automate image analysis. Despite their growing use, the impact of model training decisions on downstream ecological metrics remains unclear. Here, we analyse camera trap data from an African savannah and an Asian sub-tropical dry forest to compare key ecological metrics derived from expert-generated species identifications with those generated from deep neural networks. We assess the impact of model architecture, training data noise, and dataset size on ecological metrics, including species richness, occupancy, and activity patterns. Our results show that while model architecture has minimal impact, large amounts of noise and reduced dataset size significantly affect these metrics. Nonetheless, estimated ecological metrics are resilient to considerable noise, tolerating up to 10% error in species labels and a 50% reduction in training set size without changing significantly. We also highlight that conventional metrics like classification error may not always be representative of a model’s ability to accurately measure ecological metrics. We conclude that ecological metrics derived from deep neural network predictions closely match those calculated from expert labels and remain robust to variations in the factors explored. However, training decisions for deep neural networks can impact downstream ecological analysis. Therefore, practitioners should prioritize creating large, clean training sets and evaluate deep neural network solutions based on their ability to measure the ecological metrics of interest.

arxiv情報

著者 Omiros Pantazis,Peggy Bevan,Holly Pringle,Guilherme Braga Ferreira,Daniel J. Ingram,Emily Madsen,Liam Thomas,Dol Raj Thanet,Thakur Silwal,Santosh Rayamajhi,Gabriel Brostow,Oisin Mac Aodha,Kate E. Jones
発行日 2024-08-26 15:26:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク