Adaptive Preferential Attached kNN Graph With Distribution-Awareness

要約

グラフベースのkNNアルゴリズムは、その単純さと有効性から、機械学習タスクにおいて広く人気を集めている。しかし、従来のkNNグラフはkの固定値に依存しているため、特に複雑なデータ分布を含むシナリオでは、その性能を妨げる可能性がある。さらに、他の分類モデルと同様に、決定境界に沿って曖昧なサンプルが存在する場合、誤った分類が行われやすくなるため、しばしば課題となる。これらの問題に対処するために、我々は適応的kNNと分布に基づくグラフ構築を組み合わせたPreferential Attached k-Nearest Neighbors Graph (paNNG)を提案する。分布情報を組み込むことで、paNNGは曖昧なサンプルを元のクラスに「寄せる」ことで性能を大幅に向上させ、全体的な精度と汎化能力を向上させることができる。多様なベンチマークデータセットでの厳密な評価を通じて、paNNGは最先端のアルゴリズムを凌駕し、様々な実世界のシナリオにおける適応性と有効性を示している。

要約(オリジナル)

Graph-based kNN algorithms have garnered widespread popularity for machine learning tasks, due to their simplicity and effectiveness. However, the conventional kNN graph’s reliance on a fixed value of k can hinder its performance, especially in scenarios involving complex data distributions. Moreover, like other classification models, the presence of ambiguous samples along decision boundaries often presents a challenge, as they are more prone to incorrect classification. To address these issues, we propose the Preferential Attached k-Nearest Neighbors Graph (paNNG), which combines adaptive kNN with distribution-based graph construction. By incorporating distribution information, paNNG can significantly improve performance for ambiguous samples by ‘pulling’ them towards their original classes and hence enable enhanced overall accuracy and generalization capability. Through rigorous evaluations on diverse benchmark datasets, paNNG outperforms state-of-the-art algorithms, showcasing its adaptability and efficacy across various real-world scenarios.

arxiv情報

著者 Shaojie Min,Ji Liu
発行日 2023-08-04 16:14:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.IR, cs.LG, cs.SI パーマリンク