Matching Map Recovery with an Unknown Number of Outliers

要約

$d$ 次元のノイズを含む特徴ベクトルの 2 つのセット間で一致するマップを見つける問題を考えます。
この設定の際立った特徴は、最初のセットのすべてのベクトルが 2 番目のセットに対応するベクトルを持つとは想定していないことです。
$n$ と $m$ がこれら 2 つのセットのサイズである場合、回復する必要がある一致するマップは、未知のカーディナリティ $k^*\le \min(n,m)$ のサブセットで定義されていると想定します。
高次元設定では、信号対雑音比が $5(d\log(4nm/\alpha))^{1/4}$ より大きい場合、真の一致マップを復元できることを示します。
確率 $1-\alpha$ で。
興味深いことに、このしきい値は $k^*$ に依存せず、$k = \min(n,m)$ の場合に以前の研究で得られたものと同じです。
前述のプロパティが証明される手順は、候補マッピング $\{\hat\pi_k:k\in[\min(n,m)]\}$ の中からデータ駆動型の選択によって取得されます。
各 $\hat\pi_k$ は、サイズ $k$ の 2 つのセット間の距離の平方和を最小化します。
結果として得られる最適化問題は、最小コスト フロー問題として定式化できるため、効率的に解くことができます。
最後に、合成データと実世界データの両方に対する数値実験の結果を報告します。これは、理論的な結果を示し、この研究で研究されたアルゴリズムの特性に関するさらなる洞察を提供します。

要約(オリジナル)

We consider the problem of finding the matching map between two sets of $d$-dimensional noisy feature-vectors. The distinctive feature of our setting is that we do not assume that all the vectors of the first set have their corresponding vector in the second set. If $n$ and $m$ are the sizes of these two sets, we assume that the matching map that should be recovered is defined on a subset of unknown cardinality $k^*\le \min(n,m)$. We show that, in the high-dimensional setting, if the signal-to-noise ratio is larger than $5(d\log(4nm/\alpha))^{1/4}$, then the true matching map can be recovered with probability $1-\alpha$. Interestingly, this threshold does not depend on $k^*$ and is the same as the one obtained in prior work in the case of $k = \min(n,m)$. The procedure for which the aforementioned property is proved is obtained by a data-driven selection among candidate mappings $\{\hat\pi_k:k\in[\min(n,m)]\}$. Each $\hat\pi_k$ minimizes the sum of squares of distances between two sets of size $k$. The resulting optimization problem can be formulated as a minimum-cost flow problem, and thus solved efficiently. Finally, we report the results of numerical experiments on both synthetic and real-world data that illustrate our theoretical results and provide further insight into the properties of the algorithms studied in this work.

arxiv情報

著者 Arshak Minasyan,Tigran Galstyan,Sona Hunanyan,Arnak Dalalyan
発行日 2023-03-09 18:34:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.ST, stat.TH パーマリンク