要約
$q$ 配列を実数にマッピングする $q$ 配列関数 $f:\mathbb{Z}_{q}^n\rightarrow \mathbb{R}$ のフーリエ変換を計算することは重要です。
数学の問題を生物学、信号処理、機械学習などの幅広い用途に応用できます。
以前の研究では、スパース性の仮定の下では、高速でサンプル効率の高いアルゴリズムを使用してフーリエ変換を効率的に計算できることが示されています。
ただし、実際の多くの設定では、関数はより一般的な空間、つまり一般化された $q$ 配列 $\mathbb{Z}_{q_1} \times \mathbb{Z}_{q_2} \ の空間上で定義されます。
回 \cdots \times \mathbb{Z}_{q_n}$ — ここで、各 $\mathbb{Z}_{q_i}$ は $q_i$ を法とする整数に対応します。
素朴なアプローチでは、$q=\max_i{q_i}$ を設定し、関数を $q$-ary として扱う必要があり、その結果、計算上のオーバーヘッドが大きくなります。
ここでは、サンプル複雑度 $O(Sn)$、計算複雑度 $O(Sn \log N)$、および失敗を伴う $f$ の $S$ スパース フーリエ変換を計算するアルゴリズム GFast を開発します。
ある $0 \leq に対して $S = N^\delta$ とした場合、 $N=\prod_{i=1}^n q_i \rightarrow \infty$ としてゼロに近づく確率
\デルタ < 1$。
ノイズが存在する場合、GFast の堅牢なバージョンは、同じ高さの下で $O(Sn^2)$ のサンプル複雑さと $O(Sn^2 \log N)$ の計算複雑さで変換を計算することをさらに実証します。
確率保証。
大規模な合成実験を使用して、GFast が既存のアルゴリズムよりも $16\times$ 少ないサンプルを使用し、$8\times$ 高速に実行して、一般化 $q$-ary 関数のスパース フーリエ変換を計算することを実証します。
現実世界のタンパク質フィットネス データセットでは、GFast は既存のアルゴリズムと比較して $>25\%$ 小さい正規化平均二乗誤差を使用してニューラル ネットワークの予測相互作用を説明します。
要約(オリジナル)
Computing the Fourier transform of a $q$-ary function $f:\mathbb{Z}_{q}^n\rightarrow \mathbb{R}$, which maps $q$-ary sequences to real numbers, is an important problem in mathematics with wide-ranging applications in biology, signal processing, and machine learning. Previous studies have shown that, under the sparsity assumption, the Fourier transform can be computed efficiently using fast and sample-efficient algorithms. However, in many practical settings, the function is defined over a more general space — the space of generalized $q$-ary sequences $\mathbb{Z}_{q_1} \times \mathbb{Z}_{q_2} \times \cdots \times \mathbb{Z}_{q_n}$ — where each $\mathbb{Z}_{q_i}$ corresponds to integers modulo $q_i$. A naive approach involves setting $q=\max_i{q_i}$ and treating the function as $q$-ary, which results in heavy computational overheads. Herein, we develop GFast, an algorithm that computes the $S$-sparse Fourier transform of $f$ with a sample complexity of $O(Sn)$, computational complexity of $O(Sn \log N)$, and a failure probability that approaches zero as $N=\prod_{i=1}^n q_i \rightarrow \infty$ with $S = N^\delta$ for some $0 \leq \delta < 1$. In the presence of noise, we further demonstrate that a robust version of GFast computes the transform with a sample complexity of $O(Sn^2)$ and computational complexity of $O(Sn^2 \log N)$ under the same high probability guarantees. Using large-scale synthetic experiments, we demonstrate that GFast computes the sparse Fourier transform of generalized $q$-ary functions using $16\times$ fewer samples and running $8\times$ faster than existing algorithms. In real-world protein fitness datasets, GFast explains the predictive interactions of a neural network with $>25\%$ smaller normalized mean-squared error compared to existing algorithms.
arxiv情報
著者 | Darin Tsui,Kunal Talreja,Amirali Aghazadeh |
発行日 | 2025-01-21 18:45:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google