Martian time-series unraveled: A multi-scale nested approach with factorial variational autoencoders

要約

教師なしソース分離では、ソースに関する限られた事前知識と信号混合のデータセットのみにアクセスしながら、ミキシング オペレーターを通じて記録された未知のソース信号のセットを解明する必要があります。
この問題は本質的に不適切な問題であり、時系列データのソースによって示されるさまざまな時間スケールによってさらに困難になります。
既存の方法は通常、事前に選択されたウィンドウ サイズに依存しており、マルチスケール ソ​​ースを処理する能力が制限されています。
この問題に対処するために、時間領域で動作する代わりに、さまざまな非ガウス確率を区別できる確率過程の低次元表現を提供するウェーブレット散乱共分散を活用することで、教師なしマルチスケール クラスタリングとソース分離フレームワークを提案します。
プロセス。
この表現空間内でネストして、階乗ガウス混合変分オートエンコーダーを開発します。このオートエンコーダーは、(1) 異なるタイムスケールでソースを確率的にクラスター化し、(2) 各クラスターに関連付けられた散乱共分散表現を独立してサンプリングするようにトレーニングされます。
各クラスターからのサンプルを事前情報として使用して、ウェーブレット散乱共分散表現空間における最適化問題として音源分離を定式化し、その結果、時間領域で音源が分離されます。
火星での NASA InSight ミッション中に記録された地震データに適用すると、私たちのマルチスケールのネストされたアプローチは、時間スケールで大きく変化するソース、たとえば、数分間の過渡片側パルス (として知られている) を区別するための強力なツールであることが証明されます。
「グリッチ」)と、通常は数十分続く大気活動に起因する構造化された周囲騒音。
これらの結果は、大気と表面の相互作用、熱緩和、その他の複雑な現象に関連する孤立した発生源についてさらなる調査を行う機会を提供します。

要約(オリジナル)

Unsupervised source separation involves unraveling an unknown set of source signals recorded through a mixing operator, with limited prior knowledge about the sources, and only access to a dataset of signal mixtures. This problem is inherently ill-posed and is further challenged by the variety of time-scales exhibited by sources in time series data. Existing methods typically rely on a preselected window size that limits their capacity to handle multi-scale sources. To address this issue, instead of operating in the time domain, we propose an unsupervised multi-scale clustering and source separation framework by leveraging wavelet scattering covariances that provide a low-dimensional representation of stochastic processes, capable of distinguishing between different non-Gaussian stochastic processes. Nested within this representation space, we develop a factorial Gaussian-mixture variational autoencoder that is trained to (1) probabilistically cluster sources at different time-scales and (2) independently sample scattering covariance representations associated with each cluster. Using samples from each cluster as prior information, we formulate source separation as an optimization problem in the wavelet scattering covariance representation space, resulting in separated sources in the time domain. When applied to seismic data recorded during the NASA InSight mission on Mars, our multi-scale nested approach proves to be a powerful tool for discriminating between sources varying greatly in time-scale, e.g., minute-long transient one-sided pulses (known as “glitches”) and structured ambient noises resulting from atmospheric activities that typically last for tens of minutes. These results provide an opportunity to conduct further investigations into the isolated sources related to atmospheric-surface interactions, thermal relaxations, and other complex phenomena.

arxiv情報

著者 Ali Siahkoohi,Rudy Morel,Randall Balestriero,Erwan Allys,Grégory Sainton,Taichi Kawamura,Maarten V. de Hoop
発行日 2023-07-18 15:05:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: astro-ph.EP, cs.LG, stat.ML パーマリンク