要約
低いラベルレートにおける正準ラプラス学習アルゴリズムの縮退に対処する必要性を動機として、グラフベースの半教師あり学習を \emph{Trust-Region Subproblem} (TRS) の非凸一般化として再定式化することを提案します。
この再定式化は、無限のラベルなしデータの制限におけるラプラシアン固有ベクトルの適切な設定によって動機付けられます。
この問題を解決するために、まず、一次条件が多様体アライメント問題の解を意味することと、古典的な \emph{直交プロクラステス} 問題の解を使用して、さらなる改良に適した適切な分類器を効率的に見つけることができることを示します。
改良に取り組むために、グラフベースの SSL 用の Sequential Subspace Optimization のフレームワークを開発します。
次に、低標識率で教師付きサンプルを選択することの重要性について説明します。
グラフ ラプラシアンの特定の部分行列の主固有ベクトルから導出された中心性の新しい尺度を使用して、有益なサンプルを特徴付けます。
私たちのフレームワークは、非常に低い、中程度、および高いラベル率で、最近の最先端および古典的な半教師あり学習方法と比較して、より低い分類誤差を達成することを実証します。
要約(オリジナル)
Motivated by the need to address the degeneracy of canonical Laplace learning algorithms in low label rates, we propose to reformulate graph-based semi-supervised learning as a nonconvex generalization of a \emph{Trust-Region Subproblem} (TRS). This reformulation is motivated by the well-posedness of Laplacian eigenvectors in the limit of infinite unlabeled data. To solve this problem, we first show that a first-order condition implies the solution of a manifold alignment problem and that solutions to the classical \emph{Orthogonal Procrustes} problem can be used to efficiently find good classifiers that are amenable to further refinement. To tackle refinement, we develop the framework of Sequential Subspace Optimization for graph-based SSL. Next, we address the criticality of selecting supervised samples at low-label rates. We characterize informative samples with a novel measure of centrality derived from the principal eigenvectors of a certain submatrix of the graph Laplacian. We demonstrate that our framework achieves lower classification error compared to recent state-of-the-art and classical semi-supervised learning methods at extremely low, medium, and high label rates.
arxiv情報
著者 | Chester Holtz,Pengwen Chen,Alexander Cloninger,Chung-Kuan Cheng,Gal Mishne |
発行日 | 2024-08-14 17:57:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google