Improved theoretical guarantee for rank aggregation via spectral method

要約

複数の項目間のペアごとの比較がある場合、順位が観察結果と一致するように順位を付けるにはどうすればよいでしょうか?
ランク集計として知られるこの問題は、スポーツ、推奨システム、その他の Web アプリケーションで多くの用途に使用されています。
一般に、不一致を最小限に抑えるグローバル ランキング (ケメニー最適化と呼ばれる) を見つけるのは NP では難しいため、このランキング問題では Erd\’os-R\’enyi 外れ値 (ERO) モデルに焦点を当てます。
ここで、各ペアごとの比較は、実際のスコア差の破損したコピーです。
私たちは、正規化されていないデータ行列と正規化されたデータ行列に基づくスペクトル ランキング アルゴリズムを調査します。
重要なのは、観察されたデータから各項目の基礎となるスコアを回復する際のパフォーマンスを理解することです。
これは、正規化されていない/正規化されたデータ行列の上位固有ベクトルとそれに対応する母集団の間のエントリごとの摂動誤差の境界を導出することになります。
Leave-one-out 手法を使用することで、固有ベクトルのよりシャープな $\ell_{\infty}$-norm 摂動限界を提供し、$\Omega(n のみを使用して、各項目の最大変位に関する誤差限界も導出します)
\log n)$ 個のサンプル。
私たちの理論的分析は、サンプルの複雑さの点で最先端の結果を改善しており、数値実験はこれらの理論的発見を裏付けています。

要約(オリジナル)

Given pairwise comparisons between multiple items, how to rank them so that the ranking matches the observations? This problem, known as rank aggregation, has found many applications in sports, recommendation systems, and other web applications. As it is generally NP-hard to find a global ranking that minimizes the mismatch (known as the Kemeny optimization), we focus on the Erd\’os-R\’enyi outliers (ERO) model for this ranking problem. Here, each pairwise comparison is a corrupted copy of the true score difference. We investigate spectral ranking algorithms that are based on unnormalized and normalized data matrices. The key is to understand their performance in recovering the underlying scores of each item from the observed data. This reduces to deriving an entry-wise perturbation error bound between the top eigenvectors of the unnormalized/normalized data matrix and its population counterpart. By using the leave-one-out technique, we provide a sharper $\ell_{\infty}$-norm perturbation bound of the eigenvectors and also derive an error bound on the maximum displacement for each item, with only $\Omega(n\log n)$ samples. Our theoretical analysis improves upon the state-of-the-art results in terms of sample complexity, and our numerical experiments confirm these theoretical findings.

arxiv情報

著者 Ziliang Samuel Zhong,Shuyang Ling
発行日 2023-09-07 16:01:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.OC, stat.ML パーマリンク