要約
YOLOシリーズに代表される物体検出モデルは広く使用され、高品質なデータセットで大きな成果を上げているが、すべての作業条件が理想的とは限らない。低品質なデータセットにおけるターゲットの位置検出の問題を解決するために、既存の手法は、新しい物体検出ネットワークを学習するか、学習するために大量の低品質なデータセットを必要とする。しかし本稿では、DiffYOLOと呼ばれるフレームワークを提案し、YOLOモデルに適用する。具体的には、よく訓練されたモデルを強化するために、ノイズ除去拡散確率モデルから特徴マップを抽出し、高品質データセットでYOLOを微調整し、低品質データセットでテストすることを可能にする。この結果は、このフレームワークがノイズの多いデータセットでの性能を証明するだけでなく、高品質のテストデータセットでの検出結果も証明できることを証明した。後ほど(様々なデータセットやネットワークアーキテクチャを用いた)より多くの実験を補足する予定である。
要約(オリジナル)
Object detection models represented by YOLO series have been widely used and have achieved great results on the high quality datasets, but not all the working conditions are ideal. To settle down the problem of locating targets on low quality datasets, the existing methods either train a new object detection network, or need a large collection of low-quality datasets to train. However, we propose a framework in this paper and apply it on the YOLO models called DiffYOLO. Specifically, we extract feature maps from the denoising diffusion probabilistic models to enhance the well-trained models, which allows us fine-tune YOLO on high-quality datasets and test on low-quality datasets. The results proved this framework can not only prove the performance on noisy datasets, but also prove the detection results on high-quality test datasets. We will supplement more experiments later (with various datasets and network architectures).
arxiv情報
著者 | Yichen Liu,Huajian Zhang,Daqing Gao |
発行日 | 2024-01-03 10:35:35+00:00 |
arxivサイト | arxiv_id(pdf) |