Advanced Vision Transformers and Open-Set Learning for Robust Mosquito Classification: A Novel Approach to Entomological Studies

要約

蚊関連疾患は世界の公衆衛生に重大な脅威をもたらしており、効果的な監視と制御のためには効率的かつ正確な蚊の分類が必要です。
この研究は、最先端のビジョントランスフォーマーとオープンセット学習技術を活用した、蚊の分類に対する革新的なアプローチを示しています。
Transformer ベースの深層学習モデルと包括的なデータ拡張および前処理手法を統合する新しいフレームワークが導入され、10 種の蚊の堅牢かつ正確な識別が可能になりました。
Swin Transformer モデルは、99.80% の精度と 0.998 F1 スコアで、従来の閉集合学習において最高のパフォーマンスを達成します。
軽量の MobileViT テクニックは、パラメーターとモデルの複雑さを大幅に削減しながら、ほぼ同様の 98.90% の精度を達成します。
次に、静的環境における適用された深層学習モデルの適応性と一般化性は、トレーニング セットに含まれていない推論段階でデータ サンプルの新しいクラスを使用することによって強化されました。
提案されたフレームワークは、オープンセット学習を通じて、蚊に似た昆虫、さらには人間などの目に見えないクラスを処理する機能を備えており、OpenMax 手法とワイブル分布を採用することで、その実用性がさらに向上します。
従来の CNN モデルである Xception は、オープンセット学習の精度と F1 スコアが高く、最新のトランスフォーマーよりも優れています。
この研究結果は、昆虫学における高度な深層学習アーキテクチャの変革の可能性を浮き彫りにし、蚊の監視とベクター制御における将来の研究開発のための強力な基盤を提供します。
この研究の意味は蚊の分類を超えて広がり、より広範な生態学的および環境モニタリング用途に貴重な洞察を提供します。

要約(オリジナル)

Mosquito-related diseases pose a significant threat to global public health, necessitating efficient and accurate mosquito classification for effective surveillance and control. This work presents an innovative approach to mosquito classification by leveraging state-of-the-art vision transformers and open-set learning techniques. A novel framework has been introduced that integrates Transformer-based deep learning models with comprehensive data augmentation and preprocessing methods, enabling robust and precise identification of ten mosquito species. The Swin Transformer model achieves the best performance for traditional closed-set learning with 99.80% accuracy and 0.998 F1 score. The lightweight MobileViT technique attains an almost similar accuracy of 98.90% with significantly reduced parameters and model complexities. Next, the applied deep learning models’ adaptability and generalizability in a static environment have been enhanced by using new classes of data samples during the inference stage that have not been included in the training set. The proposed framework’s ability to handle unseen classes like insects similar to mosquitoes, even humans, through open-set learning further enhances its practical applicability by employing the OpenMax technique and Weibull distribution. The traditional CNN model, Xception, outperforms the latest transformer with higher accuracy and F1 score for open-set learning. The study’s findings highlight the transformative potential of advanced deep-learning architectures in entomology, providing a strong groundwork for future research and development in mosquito surveillance and vector control. The implications of this work extend beyond mosquito classification, offering valuable insights for broader ecological and environmental monitoring applications.

arxiv情報

著者 Ahmed Akib Jawad Karim,Muhammad Zawad Mahmud,Riasat Khan
発行日 2024-11-04 13:43:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク