Weighted Distance Nearest Neighbor Condensing

要約

最近傍凝縮の問題は、理論的側面と実践的側面の両方で長い研究の歴史があります。
この論文では、重み付けされた距離最近傍圧縮の問題を紹介します。この問題では、圧縮されたセットの各点に重みを割り当て、その後、圧縮されたセット内の重み付けされた距離最近傍に基づいて新しい点にラベルが付けられます。
我々は、この新しいモデルの理論的特性を研究し、このモデルが標準の最近傍ルールよりも劇的に優れた圧縮を生成できるにもかかわらず、後者とほぼ同じ一般化限界によって特徴付けられることを示します。
次に、新しい問題に対する要約ヒューリスティックを提案します。
このヒューリスティックに対するベイズの一貫性を実証し、有望な経験的結果も示します。

要約(オリジナル)

The problem of nearest neighbor condensing has enjoyed a long history of study, both in its theoretical and practical aspects. In this paper, we introduce the problem of weighted distance nearest neighbor condensing, where one assigns weights to each point of the condensed set, and then new points are labeled based on their weighted distance nearest neighbor in the condensed set. We study the theoretical properties of this new model, and show that it can produce dramatically better condensing than the standard nearest neighbor rule, yet is characterized by generalization bounds almost identical to the latter. We then suggest a condensing heuristic for our new problem. We demonstrate Bayes consistency for this heuristic, and also show promising empirical results.

arxiv情報

著者 Lee-Ad Gottlieb,Timor Sharabi,Roi Weiss
発行日 2023-10-24 15:51:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク