HyperspectralViTs: General Hyperspectral Models for On-board Remote Sensing


機械学習モデルを使用したハイパースペクトル データのオンボード処理により、メタン検出や鉱物識別など、幅広いタスクに対して前例のない量の自律性が可能になります。
ハイパースペクトル データ処理に関連する 2 つのタスクでモデルを評価します。
私たちが提案した一般的なアーキテクチャにより、以前のメタン検出の最先端モデルの F1 スコアが、新しく作成された合成データセットでは 27%、以前にリリースされた大規模なベンチマーク データセットでは 13% 向上しました。
また、合成データセットでモデルをトレーニングすると、最初からトレーニングした場合と比較して、実際のイベントのデータセットで微調整されたモデルのパフォーマンスが F1 スコアで 6.9% 向上することも実証します。
鉱物同定用に新しく作成されたデータセットでは、モデルのデフォルト バージョンと比較して、私たちのモデルは F1 スコアで 3.5% の改善をもたらしました。
私たちが提案したモデルでは、古典的に計算された特徴への依存を取り除くことで、以前の古典的および深層学習のアプローチと比較して、推論速度が 85% 向上しました。
私たちのアーキテクチャを使用すると、EMIT センサーからの 1 つのキャプチャは、ION-SCV 004 衛星の現実的なプロキシ上で 30 秒以内に処理できます。


On-board processing of hyperspectral data with machine learning models would enable unprecedented amount of autonomy for a wide range of tasks, for example methane detection or mineral identification. This can enable early warning system and could allow new capabilities such as automated scheduling across constellations of satellites. Classical methods suffer from high false positive rates and previous deep learning models exhibit prohibitive computational requirements. We propose fast and accurate machine learning architectures which support end-to-end training with data of high spectral dimension without relying on hand-crafted products or spectral band compression preprocessing. We evaluate our models on two tasks related to hyperspectral data processing. With our proposed general architectures, we improve the F1 score of the previous methane detection state-of-the-art models by 27% on a newly created synthetic dataset and by 13% on the previously released large benchmark dataset. We also demonstrate that training models on the synthetic dataset improves performance of models finetuned on the dataset of real events by 6.9% in F1 score in contrast with training from scratch. On a newly created dataset for mineral identification, our models provide 3.5% improvement in the F1 score in contrast to the default versions of the models. With our proposed models we improve the inference speed by 85% in contrast to previous classical and deep learning approaches by removing the dependency on classically computed features. With our architecture, one capture from the EMIT sensor can be processed within 30 seconds on realistic proxy of the ION-SCV 004 satellite.


著者 Vít Růžička,Andrew Markham
発行日 2024-10-24 15:06:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク