要約
無人航空機 (UAV) は捜索救助 (SAR) 業務に革命をもたらしましたが、機械学習モデルをトレーニングするための専用の人体検出データセットの欠如が大きな課題となっています。このギャップに対処するために、このペーパーでは Combination to Application (C2A) データセットを紹介します。
、UAVが撮影した災害現場に人間のポーズを重ねて合成したもの。
最先端の検出モデルを使用した広範な実験を通じて、C2A データセットで微調整されたモデルは、一般的な航空データセットで事前トレーニングされたモデルと比較して大幅なパフォーマンスの向上を示すことを実証しました。
さらに、さまざまなシナリオにわたって最適なパフォーマンスと一般化を達成するには、C2A データセットを一般的な人間のデータセットと組み合わせることが重要であることを強調します。
これは、SAR 運用の有効性を高めるために、カスタマイズされたデータセットが非常に必要であることを示しています。
私たちの貢献には、データセット作成パイプラインの開発や、災害シナリオの深刻度を評価するための人間の多様なポーズと災害現場の情報の統合も含まれます。
私たちの調査結果は、SAR 運用が可能な限り最も現実的かつ効果的な AI 支援介入から確実に利益を得られるようにするための、将来の開発を提唱しています。
要約(オリジナル)
Unmanned aerial vehicles (UAVs) have revolutionized search and rescue (SAR) operations, but the lack of specialized human detection datasets for training machine learning models poses a significant challenge.To address this gap, this paper introduces the Combination to Application (C2A) dataset, synthesized by overlaying human poses onto UAV-captured disaster scenes. Through extensive experimentation with state-of-the-art detection models, we demonstrate that models fine-tuned on the C2A dataset exhibit substantial performance improvements compared to those pre-trained on generic aerial datasets. Furthermore, we highlight the importance of combining the C2A dataset with general human datasets to achieve optimal performance and generalization across various scenarios. This points out the crucial need for a tailored dataset to enhance the effectiveness of SAR operations. Our contributions also include developing dataset creation pipeline and integrating diverse human poses and disaster scenes information to assess the severity of disaster scenarios. Our findings advocate for future developments, to ensure that SAR operations benefit from the most realistic and effective AI-assisted interventions possible.
arxiv情報
著者 | Ragib Amin Nihal,Benjamin Yen,Katsutoshi Itoyama,Kazuhiro Nakadai |
発行日 | 2024-08-09 08:07:19+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google