Scrapping The Web For Early Wildfire Detection: A New Annotated Dataset of Images and Videos of Smoke Plumes In-the-wild

要約

山火事の早期発見は、迅速な対応活動を可能にし、山火事の拡大による悪影響を最小限に抑えるために最も重要です。
この目的を達成するために、画像とビデオの両方で構成される新しいデータセットである PyroNear-2024 を紹介します。これにより、逐次モデルを含む煙柱検出モデルのトレーニングと評価が可能になります。
データのソースは次のとおりです: \textit{(i)} 野外での山火事探知用のカメラの公共ネットワークからウェブでスクレイピングされた山火事のビデオ、社内のカメラ ネットワークからの \text{(ii)} ビデオ、
\textit{(iii)} 合成画像と実際の画像のごく一部。
このデータセットには、50,000 枚の画像に対する約 150,000 個の手動アノテーションが含まれており、400 件の山火事をカバーしており、\Pyro はサイズと多様性において既存のデータセットを上回っています。
これには、フランス、スペイン、米国のデータが含まれています。
最後に、画像とビデオの両方で構成されているため、逐次モデルを含む煙柱検出モデルのトレーニングと評価が可能になります。
軽量の最先端の物体検出モデルを使用してデータセット間実験を実行したところ、提案されたデータセットは特に困難であり、F1 スコアは約 60% ですが、既存のデータセットよりも安定していることがわかりました。
データセットのビデオ部分を使用して軽量の逐次モデルをトレーニングし、精度を維持しながら全体的な再現率を向上させることができます。
最後に、他の公開データセットと組み合わせて使用​​すると、全体的により高い結果を達成するのに役立ちます。
コードとデータの両方を利用できるようにします。

要約(オリジナル)

Early wildfire detection is of the utmost importance to enable rapid response efforts, and thus minimize the negative impacts of wildfire spreads. To this end, we present PyroNear-2024, a new dataset composed of both images and videos, allowing for the training and evaluation of smoke plume detection models, including sequential models. The data is sourced from: \textit{(i)} web-scraped videos of wildfires from public networks of cameras for wildfire detection in-the-wild, \text{(ii)} videos from our in-house network of cameras, and \textit{(iii)} a small portion of synthetic and real images. This dataset includes around 150,000 manual annotations on 50,000 images, covering 400 wildfires, \Pyro surpasses existing datasets in size and diversity. It includes data from France, Spain, and the United States. Finally, it is composed of both images and videos, allowing for the training and evaluation of smoke plume detection models, including sequential models. We ran cross-dataset experiments using a lightweight state-of-the-art object detection model and found out the proposed dataset is particularly challenging, with F1 score of around 60%, but more stable than existing datasets. The video part of the dataset can be used to train a lightweight sequential model, improving global recall while maintaining precision. Finally, its use in concordance with other public dataset helps to reach higher results overall. We will make both our code and data available.

arxiv情報

著者 Mateo Lostanlen,Nicolas Isla,Jose Guillen,Felix Veith,Cristian Buc,Valentin Barriere
発行日 2024-11-22 16:07:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク