p$^3$VAE: a physics-integrated generative model. Application to the semantic segmentation of optical remote sensing images

要約

機械学習モデルと物理モデルの組み合わせは、ロバストなデータ表現を学習するための最近の研究道である。本論文では、データの変動要因を部分的に説明する完全な物理モデルを統合した生成モデルであるp$^3$VAEを紹介する。このハイブリッドデザインを十分に活用するために、我々は半教師付き最適化手順と、意味のある不確実性推定を伴う推論スキームを提案する。我々はp$^3$VAEを高解像度ハイパースペクトルリモートセンシング画像のセマンティックセグメンテーションに適用する。模擬データを用いた実験により、外挿能力および解釈可能性の観点から、従来の機械学習モデルに対する我々のハイブリッドモデルの利点を実証した。特に、p$^3$VAEが自然に高い外挿能力を持つことを示す。我々のコードとデータは、https://github.com/Romain3Ch216/p3VAE で公開されている。

要約(オリジナル)

The combination of machine learning models with physical models is a recent research path to learn robust data representations. In this paper, we introduce p$^3$VAE, a generative model that integrates a perfect physical model which partially explains the true underlying factors of variation in the data. To fully leverage our hybrid design, we propose a semi-supervised optimization procedure and an inference scheme that comes along meaningful uncertainty estimates. We apply p$^3$VAE to the semantic segmentation of high-resolution hyperspectral remote sensing images. Our experiments on a simulated data set demonstrated the benefits of our hybrid model against conventional machine learning models in terms of extrapolation capabilities and interpretability. In particular, we show that p$^3$VAE naturally has high disentanglement capabilities. Our code and data have been made publicly available at https://github.com/Romain3Ch216/p3VAE.

arxiv情報

著者 Romain Thoreau,Laurent Risser,Véronique Achard,Béatrice Berthelot,Xavier Briottet
発行日 2022-11-08 11:11:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: 68T45, cs.CV, I.2.10, stat.ML パーマリンク