Geographic Location Encoding with Spherical Harmonics and Sinusoidal Representation Networks

要約

地理空間の特徴表現の学習は、リモート センシング、生態学、疫学などのアプリケーション ドメインにわたる地理位置情報データを統合する機械学習モデルにとって不可欠です。
最近の研究では、主に Double Fourier Sphere (DFS) 特徴に基づいたサインおよびコサイン投影を使用して座標を埋め込んでいます。これらの埋め込みでは、グローバル データ上でも長方形のデータ ドメインを想定しているため、特に極でアーティファクトが発生する可能性があります。
同時に、これらの機能的埋め込みが組み合わされるニューラル ネットワーク アーキテクチャの正確な設計には、比較的ほとんど注意が払われてきませんでした。
この研究では、球面上にネイティブに定義された球面調和基底関数と、学習された二重フーリエ球埋め込みとして解釈できる正弦波表現ネットワーク (SirenNets) を組み合わせた、グローバルに分散された地理データ用の新しい位置エンコーダーを提案します。
私たちは、さまざまな分類および回帰ベンチマークと合成評価データセットにわたって、位置埋め込みとニューラル ネットワーク アーキテクチャの外積を体系的に評価します。
意味のある表現を学習するために位置エンコーディングとニューラル ネットワークの両方を組み合わせる必要があるこれまでのアプローチとは対照的に、球面調和関数と正弦波表現ネットワークは両方とも単独では競争力があるが、組み合わせるとタスク全体で最先端のパフォーマンスを発揮することを示します。

ソースコードは www.github.com/marccoru/locationencoder で提供しています。

要約(オリジナル)

Learning feature representations of geographical space is vital for any machine learning model that integrates geolocated data, spanning application domains such as remote sensing, ecology, or epidemiology. Recent work mostly embeds coordinates using sine and cosine projections based on Double Fourier Sphere (DFS) features — these embeddings assume a rectangular data domain even on global data, which can lead to artifacts, especially at the poles. At the same time, relatively little attention has been paid to the exact design of the neural network architectures these functional embeddings are combined with. This work proposes a novel location encoder for globally distributed geographic data that combines spherical harmonic basis functions, natively defined on spherical surfaces, with sinusoidal representation networks (SirenNets) that can be interpreted as learned Double Fourier Sphere embedding. We systematically evaluate the cross-product of positional embeddings and neural network architectures across various classification and regression benchmarks and synthetic evaluation datasets. In contrast to previous approaches that require the combination of both positional encoding and neural networks to learn meaningful representations, we show that both spherical harmonics and sinusoidal representation networks are competitive on their own but set state-of-the-art performances across tasks when combined. We provide source code at www.github.com/marccoru/locationencoder

arxiv情報

著者 Marc Rußwurm,Konstantin Klemmer,Esther Rolf,Robin Zbinden,Devis Tuia
発行日 2023-10-10 16:12:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク