要約
このペーパーでは、オブジェクト検出モデルのパフォーマンスに対するさまざまなデータ増強技術の影響を調査します。
具体的には、古典的な増強方法、画像の構成、および安定した拡散XLやコントロールネットなどの高度な生成モデルを探ります。
この作業の目的は、特に限られた注釈付きデータを使用する場合、モデルの堅牢性を高め、検出精度を向上させることです。
Yolov8を使用して、さまざまな増強戦略を適用して、市販の航空機と軍用機で構成されるカスタムデータセットでモデルを微調整します。
私たちの実験では、画像合成が、精度、リコール、平均平均精度(map@0.50)で測定されるように、検出性能の最大の改善を提供することが示されています。
安定した拡散XLやControlNetを含む他の方法も、オブジェクト検出タスクの高度なデータ増強技術の可能性を強調している大幅な利益を示しています。
結果は、現実世界のアプリケーションでより良い一般化とパフォーマンスを達成する上でのデータセットの多様性と増強の重要性を強調しています。
将来の作業では、半監視学習方法の統合と、より大きく複雑なデータセット全体でモデルのパフォーマンスを向上させるためのさらなる最適化を探ります。
要約(オリジナル)
This paper investigates the impact of various data augmentation techniques on the performance of object detection models. Specifically, we explore classical augmentation methods, image compositing, and advanced generative models such as Stable Diffusion XL and ControlNet. The objective of this work is to enhance model robustness and improve detection accuracy, particularly when working with limited annotated data. Using YOLOv8, we fine-tune the model on a custom dataset consisting of commercial and military aircraft, applying different augmentation strategies. Our experiments show that image compositing offers the highest improvement in detection performance, as measured by precision, recall, and mean Average Precision (mAP@0.50). Other methods, including Stable Diffusion XL and ControlNet, also demonstrate significant gains, highlighting the potential of advanced data augmentation techniques for object detection tasks. The results underline the importance of dataset diversity and augmentation in achieving better generalization and performance in real-world applications. Future work will explore the integration of semi-supervised learning methods and further optimizations to enhance model performance across larger and more complex datasets.
arxiv情報
著者 | Ang Jia Ning Shermaine,Michalis Lazarou,Tania Stathaki |
発行日 | 2025-02-19 18:24:02+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google