PhenoBench — A Large Dataset and Benchmarks for Semantic Image Interpretation in the Agricultural Domain

要約

食料、飼料、繊維、燃料の生産は農業の重要な仕事です。
特に作物生産は、世界人口の増加、気候変動、持続可能な生産の必要性、熟練労働者の不足、そして一般に利用可能な耕地が限られていることが原因で、今後数十年間にわたり多くの課題に対処しなければなりません。
ビジョンシステムは、より適切で持続可能な圃場管理の意思決定を行うためのツールを提供し、時間的に高密度で再現可能な測定を可能にすることで新しい品種の作物の育種をサポートするツールを提供することで、これらの課題に対処するのに役立つ可能性があります。
最近、農業分野での知覚タスクへの取り組みは、農業ロボット工学が労働者不足に対処し、同時により持続可能な農業生産を可能にする有望なソリューションの 1 つであるため、コンピューター ビジョンとロボット工学コミュニティの関心が高まっています。
他の分野の大規模なデータセットやベンチマークはすぐに利用でき、より信頼性の高いビジョン システムに向けた大きな進歩を可能にしましたが、農業用のデータセットやベンチマークは比較的まれです。
この論文では、実際の農地の画像を意味論的に解釈するための大規模なデータセットとベンチマークを紹介します。
UAV で記録された当社のデータセットは、作物や雑草の高品質で緻密な注釈を提供するだけでなく、同時に作物の葉のきめの細かいラベルも提供します。これにより、農業分野における視覚認識のための新しいアルゴリズムの開発が可能になります。
ラベル付けされたデータと併せて、さまざまなフィールド (トレーニング データでカバーされる既知のフィールドとまったく目に見えないフィールド) で構成される隠れたテスト セットでさまざまな視覚認識タスクを評価するための新しいベンチマークを提供します。
タスクには、セマンティック セグメンテーション、植物のパノプティック セグメンテーション、葉インスタンス セグメンテーション、植物と葉の検出、および植物と葉を一緒に識別するための階層パノプティック セグメンテーションが含まれます。

要約(オリジナル)

The production of food, feed, fiber, and fuel is a key task of agriculture. Especially crop production has to cope with a multitude of challenges in the upcoming decades caused by a growing world population, climate change, the need for sustainable production, lack of skilled workers, and generally the limited availability of arable land. Vision systems could help cope with these challenges by offering tools to make better and more sustainable field management decisions and support the breeding of new varieties of crops by allowing temporally dense and reproducible measurements. Recently, tackling perception tasks in the agricultural domain got increasing interest in the computer vision and robotics community since agricultural robotics are one promising solution for coping with the lack of workers and enable a more sustainable agricultural production at the same time. While large datasets and benchmarks in other domains are readily available and have enabled significant progress toward more reliable vision systems, agricultural datasets and benchmarks are comparably rare. In this paper, we present a large dataset and benchmarks for the semantic interpretation of images of real agricultural fields. Our dataset recorded with a UAV provides high-quality, dense annotations of crops and weeds, but also fine-grained labels of crop leaves at the same time, which enable the development of novel algorithms for visual perception in the agricultural domain. Together with the labeled data, we provide novel benchmarks for evaluating different visual perception tasks on a hidden test set comprised of different fields: known fields covered by the training data and a completely unseen field. The tasks cover semantic segmentation, panoptic segmentation of plants, leaf instance segmentation, detection of plants and leaves, and hierarchical panoptic segmentation for jointly identifying plants and leaves.

arxiv情報

著者 Jan Weyler,Federico Magistri,Elias Marks,Yue Linn Chong,Matteo Sodano,Gianmarco Roggiolani,Nived Chebrolu,Cyrill Stachniss,Jens Behley
発行日 2023-06-07 16:04:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク