Coconut Palm Tree Counting on Drone Images with Deep Object Detection and Synthetic Training Data

要約

ドローンは農業を含むさまざまな領域に革命をもたらしました。
深層学習の最近の進歩により、特にコンピューター ビジョンにおけるオブジェクト検出が推進されています。
この研究では、リアルタイム物体検出器 YOLO を利用して、ガーナの農場のドローン映像に含まれるヤシの木を特定し、数えました。
紹介された農場では、植栽の段階が異なるため、樹木を見失っています。
手動で数えることは非常に面倒で間違いが起こりやすいですが、木の数を正確に決定することは、農業プロセスの効率的な計画と管理、特に収量の最適化と生産量の予測にとって非常に重要です。
私たちは、半自動フレームワーク内で手のひら検出のための YOLO を評価し、精度の向上を評価し、農家にとっての可能性を熟考しました。
データは 2022 年 9 月にドローンによって取得されました。
希少なデータで YOLO を最適化するために、モデルのトレーニングと検証用に合成画像が作成されました。
COCO データセット (ココヤシを除く) で事前トレーニングされた YOLOv7 モデルは、調整されたデータを使用して適応されました。
映像の木は合成画像上で再配置され、別個の本物の画像上でテストされました。
実験ではハイパーパラメータを調整し、YOLO の平均平均精度 (mAP) を改善しました。
また、最適なドローンの高さを決定するために、さまざまな高度をテストしました。
$0.65$ の初期 mAP@.5 から 0.88 を達成し、農業シナリオにおける合成画像の価値を強調しました。

要約(オリジナル)

Drones have revolutionized various domains, including agriculture. Recent advances in deep learning have propelled among other things object detection in computer vision. This study utilized YOLO, a real-time object detector, to identify and count coconut palm trees in Ghanaian farm drone footage. The farm presented has lost track of its trees due to different planting phases. While manual counting would be very tedious and error-prone, accurately determining the number of trees is crucial for efficient planning and management of agricultural processes, especially for optimizing yields and predicting production. We assessed YOLO for palm detection within a semi-automated framework, evaluated accuracy augmentations, and pondered its potential for farmers. Data was captured in September 2022 via drones. To optimize YOLO with scarce data, synthetic images were created for model training and validation. The YOLOv7 model, pretrained on the COCO dataset (excluding coconut palms), was adapted using tailored data. Trees from footage were repositioned on synthetic images, with testing on distinct authentic images. In our experiments, we adjusted hyperparameters, improving YOLO’s mean average precision (mAP). We also tested various altitudes to determine the best drone height. From an initial mAP@.5 of $0.65$, we achieved 0.88, highlighting the value of synthetic images in agricultural scenarios.

arxiv情報

著者 Tobias Rohe,Barbara Böhm,Michael Kölle,Jonas Stein,Robert Müller,Claudia Linnhoff-Popien
発行日 2024-12-16 16:33:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク