要約
タイトル: 「GAANet:暗闇の中で異なるサイズのドローンを検出するためのGhost Auto Anchor Network」
要約:
– ドローンの使用は、軍事から産業分野まで、様々な分野で急速に増加している。
– ドローンを使用することで、多くの利点がある一方で、誤用による事故が起こることもあり、特に夜間にはドローンの小ささや視認性の低さにより、その対処はより困難になっている。
– この問題を克服し、夜間の検出精度を向上させるために、著者らはGhost Auto Anchor Network(GAANet)と呼ばれるオブジェクト検出器を提案している。
– GAANetは、IR画像のオブジェクト検出の課題(拡張高度、照度の低さ、低画質などによる精度の低下や高い誤検出率など)に対処するために、YOLOv5というコアを使用している。
– 性能を向上させるために、自動アンカー計算、従来の畳み込みブロックをゴースト畳み込みに変更、入力チャンネルサイズを調整、AdamWオプティマイザを使用するなどの工夫をしている。
– また、多スケールの小さなオブジェクト認識の精度を向上させるために、追加のExtra-Smallオブジェクトフィーチャーエクストラクタとディテクタを導入している。
– 複数のクラス(鳥、ドローン、飛行機、ヘリコプター)のカスタムIRデータセットでの実験結果により、GAANetは最先端の検出器と比較して、全体的な平均平均精度(mAP@ 50)、リコール、精度の改善が見られた。
– この論文のデータセットとコードは、https://github.com/ZeeshanKaleem/GhostAutoAnchorNetでオープンソースとして利用可能。
要約(オリジナル)
The usage of drones has tremendously increased in different sectors spanning from military to industrial applications. Despite all the benefits they offer, their misuse can lead to mishaps, and tackling them becomes more challenging particularly at night due to their small size and low visibility conditions. To overcome those limitations and improve the detection accuracy at night, we propose an object detector called Ghost Auto Anchor Network (GAANet) for infrared (IR) images. The detector uses a YOLOv5 core to address challenges in object detection for IR images, such as poor accuracy and a high false alarm rate caused by extended altitudes, poor lighting, and low image resolution. To improve performance, we implemented auto anchor calculation, modified the conventional convolution block to ghost-convolution, adjusted the input channel size, and used the AdamW optimizer. To enhance the precision of multiscale tiny object recognition, we also introduced an additional extra-small object feature extractor and detector. Experimental results in a custom IR dataset with multiple classes (birds, drones, planes, and helicopters) demonstrate that GAANet shows improvement compared to state-of-the-art detectors. In comparison to GhostNet-YOLOv5, GAANet has higher overall mean average precision (mAP@50), recall, and precision around 2.5\%, 2.3\%, and 1.4\%, respectively. The dataset and code for this paper are available as open source at https://github.com/ZeeshanKaleem/GhostAutoAnchorNet.
arxiv情報
著者 | Misha Urooj Khan,Maham Misbah,Zeeshan Kaleem,Yansha Deng,Abbas Jamalipour |
発行日 | 2023-05-05 10:46:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI