N$^2$: A Unified Python Package and Test Bench for Nearest Neighbor-Based Matrix Completion

要約

最近傍(NN)メソッドは、マトリックスの完了のための競争ツールとして再現され、エントリーごとのエラー境界、信頼区間、ミニマックスの最適性など、強力な経験的パフォーマンスと最近の理論的保証を提供します。
それらの単純さにもかかわらず、最近の研究は、NNアプローチがさまざまな欠落パターンに堅牢であり、多様なアプリケーション全体で効果的であることを示しています。
このペーパーでは、モジュール式の拡張可能なインターフェイスを介して、幅広いクラスのNNベースの方法を統合する統一されたPythonパッケージとテストベッドであるn $^2 $を紹介します。
研究者と実践者の両方のために構築されたn $^2 $は、迅速な実験とベンチマークをサポートしています。
このフレームワークを使用して、いくつかの設定で最新の結果を達成する新しいNNバリアントを紹介します。
また、ヘルスケアや推奨システムから、合成シナリオを超えてマトリックス完了方法をスト​​レステストするように設計された因果推論とLLM評価まで、実世界のデータセットのベンチマークスイートをリリースします。
私たちの実験は、古典的な方法が理想化されたデータに優れている一方で、NNベースの手法が実際の設定で一貫してそれらを上回ることを示しています。

要約(オリジナル)

Nearest neighbor (NN) methods have re-emerged as competitive tools for matrix completion, offering strong empirical performance and recent theoretical guarantees, including entry-wise error bounds, confidence intervals, and minimax optimality. Despite their simplicity, recent work has shown that NN approaches are robust to a range of missingness patterns and effective across diverse applications. This paper introduces N$^2$, a unified Python package and testbed that consolidates a broad class of NN-based methods through a modular, extensible interface. Built for both researchers and practitioners, N$^2$ supports rapid experimentation and benchmarking. Using this framework, we introduce a new NN variant that achieves state-of-the-art results in several settings. We also release a benchmark suite of real-world datasets, from healthcare and recommender systems to causal inference and LLM evaluation, designed to stress-test matrix completion methods beyond synthetic scenarios. Our experiments demonstrate that while classical methods excel on idealized data, NN-based techniques consistently outperform them in real-world settings.

arxiv情報

著者 Caleb Chin,Aashish Khubchandani,Harshvardhan Maskara,Kyuseong Choi,Jacob Feitelberg,Albert Gong,Manit Paul,Tathagata Sadhukhan,Anish Agarwal,Raaz Dwivedi
発行日 2025-06-04 17:04:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.CO, stat.ML パーマリンク