Samplet basis pursuit: Multiresolution scattered data approximation with sparsity constraints

要約

$\ell_1$ 正則化を使用したサンプルレット座標での散乱データ近似を考慮します。
$\ell_1$ 正則化項を適用すると、サンプルレット基底に関して係数のスパース性が強制されます。
サンプルレットは、散在データに合わせて調整されたウェーブレット タイプの符号付きメジャーです。
したがって、サンプルレットを使用すると、一般的な散乱データ セットに対して確立された多重解像度技術を使用できるようになります。
これらは、位置特定、多重解像度解析、データ圧縮の点でウェーブレットと同様のプロパティを提供します。
Riesz アイソメトリを使用することで、再現カーネル ヒルベルト空間にサンプレットを埋め込み、結果として得られる関数の特性について議論します。
我々は、埋め込まれたサンプレットの基礎に関して疎な信号のクラスは、カーネル変換の基礎に関して疎な信号のクラスよりもかなり大きいと主張します。
逆に、少数のカーネル変換のみの線形結合であるすべての信号は、サンプレット座標内でまばらになります。
我々は、軟収縮と半滑らかなニュートン法を組み合わせることにより、検討中の問題を迅速に解決することを提案します。
サンプルレット座標におけるカーネル行列のスパース表現を利用するこのアプローチは、高速反復収縮しきい値アルゴリズムよりも速く収束し、大規模なデータに実行可能です。
数値ベンチマークが提示され、単一スケール アプローチに対する多重解像度アプローチの優位性が実証されています。
大規模な応用例としては、散乱データからの表面再構成や、複数のカーネルの辞書を用いた散乱温度データの再構成などが考えられる。

要約(オリジナル)

We consider scattered data approximation in samplet coordinates with $\ell_1$-regularization. The application of an $\ell_1$-regularization term enforces sparsity of the coefficients with respect to the samplet basis. Samplets are wavelet-type signed measures, which are tailored to scattered data. Therefore, samplets enable the use of well-established multiresolution techniques on general scattered data sets. They provide similar properties as wavelets in terms of localization, multiresolution analysis, and data compression. By using the Riesz isometry, we embed samplets into reproducing kernel Hilbert spaces and discuss the properties of the resulting functions. We argue that the class of signals that are sparse with respect to the embedded samplet basis is considerably larger than the class of signals that are sparse with respect to the basis of kernel translates. Vice versa, every signal that is a linear combination of only a few kernel translates is sparse in samplet coordinates. We propose the rapid solution of the problem under consideration by combining soft-shrinkage with the semi-smooth Newton method. Leveraging on the sparse representation of kernel matrices in samplet coordinates, this approach converges faster than the fast iterative shrinkage thresholding algorithm and is feasible for large-scale data. Numerical benchmarks are presented and demonstrate the superiority of the multiresolution approach over the single-scale approach. As large-scale applications, the surface reconstruction from scattered data and the reconstruction of scattered temperature data using a dictionary of multiple kernels are considered.

arxiv情報

著者 Davide Baroli,Helmut Harbrecht,Michael Multerer
発行日 2024-04-02 15:40:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.NA, math.NA, stat.ML パーマリンク