DEAL-YOLO: Drone-based Efficient Animal Localization using YOLO

要約

深い学習と空中監視技術の進歩により、野生生物の保全の取り組みが改善されていますが、複雑で不安定な環境条件が依然として問題を引き起こし、費用対効果の高い小動物検出のための革新的なソリューションを必要とします。
この作業では、Wise Iou(Wiou)や正規化されたWasserstein距離(NWD)などの多目的損失関数を使用して、無人航空機(UAV)画像の小さなオブジェクト検出を改善する新しいアプローチであるDeal-Yoloを紹介します。
さらに、このモデルは、線形変形(LD)畳み込みによる効率的な特徴抽出により最適化され、計算効率を維持しながら精度を向上させます。
スケーリングされたシーケンス特徴融合(SSFF)モジュールは、スケール間の関係を効果的にキャプチャし、特徴表現を改善し、最適化されたマルチスケール融合を介してメトリックをブーストすることにより、オブジェクトの検出を強化します。
ベースラインモデルとの比較により、バニラYolov8-Nと比較して最大69.5%少ないパラメーターで高い有効性が明らかになり、提案された修正の堅牢性を強調しています。
このアプローチを通じて、私たちの論文は、絶滅危species種の検出、動物集団分析、生息地の監視、生物多様性の研究、および野生生物保護の取り組みを豊かにする他のさまざまなアプリケーションの検出を促進することを目的としています。
Deal-Yoloは、オブジェクト検出のために2段階の推論パラダイムを採用し、選択した領域を改良してローカリゼーションと自信を改善します。
このアプローチは、特にオブジェクト性スコアが低い小さなインスタンスでパフォーマンスを向上させます。

要約(オリジナル)

Although advances in deep learning and aerial surveillance technology are improving wildlife conservation efforts, complex and erratic environmental conditions still pose a problem, requiring innovative solutions for cost-effective small animal detection. This work introduces DEAL-YOLO, a novel approach that improves small object detection in Unmanned Aerial Vehicle (UAV) images by using multi-objective loss functions like Wise IoU (WIoU) and Normalized Wasserstein Distance (NWD), which prioritize pixels near the centre of the bounding box, ensuring smoother localization and reducing abrupt deviations. Additionally, the model is optimized through efficient feature extraction with Linear Deformable (LD) convolutions, enhancing accuracy while maintaining computational efficiency. The Scaled Sequence Feature Fusion (SSFF) module enhances object detection by effectively capturing inter-scale relationships, improving feature representation, and boosting metrics through optimized multiscale fusion. Comparison with baseline models reveals high efficacy with up to 69.5\% fewer parameters compared to vanilla Yolov8-N, highlighting the robustness of the proposed modifications. Through this approach, our paper aims to facilitate the detection of endangered species, animal population analysis, habitat monitoring, biodiversity research, and various other applications that enrich wildlife conservation efforts. DEAL-YOLO employs a two-stage inference paradigm for object detection, refining selected regions to improve localization and confidence. This approach enhances performance, especially for small instances with low objectness scores.

arxiv情報

著者 Aditya Prashant Naidu,Hem Gosalia,Ishaan Gakhar,Shaurya Singh Rathore,Krish Didwania,Ujjwal Verma
発行日 2025-03-06 18:46:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク