Using reinforcement learning to improve drone-based inference of greenhouse gas fluxes

要約

地表における温室効果ガスのフラックスを正確にマッピングすることは、気候モデルの検証と校正に不可欠です。
この研究では、ドローンを使用した表面フラックス推定のフレームワークを紹介します。
私たちのアプローチでは、データ同化 (DA) を使用してドローンベースの観測からフラックスを推測し、強化学習 (RL) を使用してドローンのサンプリング戦略を最適化します。
ここでは、RL で訓練されたドローンが、排出プルームを横切る事前定義された飛行経路に沿ってサンプリングするドローンよりも正確に CO2 ホットスポットを定量できることを実証します。
情報ベースの報酬関数は、推定された表面光束と真の値との差を定量化する誤差ベースの報酬関数のパフォーマンスと同等であることがわかりました。
情報ゲインと情報エントロピーに基づく報酬関数は、真の表面フラックスの知識を必要とせずに、更新された信念に対するドローンの信頼を高めるアクションを動機付けることができます。
これらの発見は、より複雑な表面磁束場のマッピングのためのフレームワークのさらなる開発に貴重な洞察を提供します。

要約(オリジナル)

Accurate mapping of greenhouse gas fluxes at the Earth’s surface is essential for the validation and calibration of climate models. In this study, we present a framework for surface flux estimation with drones. Our approach uses data assimilation (DA) to infer fluxes from drone-based observations, and reinforcement learning (RL) to optimize the drone’s sampling strategy. Herein, we demonstrate that a RL-trained drone can quantify a CO2 hotspot more accurately than a drone sampling along a predefined flight path that traverses the emission plume. We find that information-based reward functions can match the performance of an error-based reward function that quantifies the difference between the estimated surface flux and the true value. Reward functions based on information gain and information entropy can motivate actions that increase the drone’s confidence in its updated belief, without requiring knowledge of the true surface flux. These findings provide valuable insights for further development of the framework for the mapping of more complex surface flux fields.

arxiv情報

著者 Alouette van Hove,Kristoffer Aalstad,Norbert Pirk
発行日 2024-01-08 14:45:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO, physics.ao-ph パーマリンク