Automated wildlife image classification: An active learning tool for ecological applications

要約

野生動物のカメラトラップ画像は、動物の生息数、生息地の関連性、行動を調査するために広く使用されていますが、専門家が最初に画像を手動で分類する必要があるという事実により、作業が複雑になります。
人工知能システムがこのタスクを引き継ぐことはできますが、通常、十分なパフォーマンスを達成するには、すでにラベル付けされた大量のトレーニング画像が必要です。
この要件には人間の専門家による作業が必要であり、カメラの数が少ないプロジェクトや所要時間が短いプロジェクトには特に課題が生じます。
私たちは、小規模または中規模の画像データベースを持つ研究者が最新の機械学習の可能性を活用できるようにする、ラベル効率の良い学習戦略を提案します。これにより、その後の分析に重要なリソースが解放されます。
私たちの方法論的な提案は 2 つあります: (1) 両方のモデルのハイパーパラメーターを調整することで、物体検出と画像分類を組み合わせる現在の戦略を改善します。
(2) 必要な人間ラベル付きトレーニング画像に関して、深層学習モデルを非常に効率的にトレーニングできるアクティブ ラーニング (AL) システムを提供します。
当社は、研究者がこれらの手法を直接使用できるようにするソフトウェア パッケージを提供し、それによって提案されたフレームワークが生態学の実践に幅広く適用できることを保証します。
調整戦略が予測パフォーマンスを向上させることを示します。
AL パイプラインが特定の予測パフォーマンスを達成するために必要な事前にラベル付けされたデータの量をどのように削減するか、またそれがサンプル外の予測パフォーマンスを向上させるのに特に有益であることを示します。
チューニングと AL を組み合わせると、予測パフォーマンスが大幅に向上すると結論付けています。
さらに、私たちの仕事は、提供されるすぐに使えるソフトウェア パッケージを通じてコミュニティに広く影響を与えることができると主張します。
最後に、ヨーロッパの野生生物データに合わせたモデルの公開により、主にアフリカと北アメリカのデータに基づいてトレーニングされた既存のモデルベースが強化されます。

要約(オリジナル)

Wildlife camera trap images are being used extensively to investigate animal abundance, habitat associations, and behavior, which is complicated by the fact that experts must first classify the images manually. Artificial intelligence systems can take over this task but usually need a large number of already-labeled training images to achieve sufficient performance. This requirement necessitates human expert labor and poses a particular challenge for projects with few cameras or short durations. We propose a label-efficient learning strategy that enables researchers with small or medium-sized image databases to leverage the potential of modern machine learning, thus freeing crucial resources for subsequent analyses. Our methodological proposal is two-fold: (1) We improve current strategies of combining object detection and image classification by tuning the hyperparameters of both models. (2) We provide an active learning (AL) system that allows training deep learning models very efficiently in terms of required human-labeled training images. We supply a software package that enables researchers to use these methods directly and thereby ensure the broad applicability of the proposed framework in ecological practice. We show that our tuning strategy improves predictive performance. We demonstrate how the AL pipeline reduces the amount of pre-labeled data needed to achieve a specific predictive performance and that it is especially valuable for improving out-of-sample predictive performance. We conclude that the combination of tuning and AL increases predictive performance substantially. Furthermore, we argue that our work can broadly impact the community through the ready-to-use software package provided. Finally, the publication of our models tailored to European wildlife data enriches existing model bases mostly trained on data from Africa and North America.

arxiv情報

著者 Ludwig Bothmann,Lisa Wimmer,Omid Charrakh,Tobias Weber,Hendrik Edelhoff,Wibke Peters,Hien Nguyen,Caryl Benjamin,Annette Menzel
発行日 2023-07-21 14:55:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, stat.AP パーマリンク