要約
半教師あり学習は、ラベル付けされたデータが少なく、ラベル付けされていないデータが豊富な一般的なシナリオで非常に役立ちます。
グラフ (または非局所) ラプラシアンは、さまざまな学習タスクを解決するための基本的な平滑化演算子です。
教師なしクラスタリングでは、グラフ ラプラシアン固有ベクトルに基づくスペクトル埋め込みがよく使用されます。
半教師あり問題の一般的なアプローチは、グラフ ラプラシアンに基づいて、ディリクレ エネルギーによって正則化された制約付き最適化問題を解くことです。
ただし、監視が減少するにつれて、ディリクレ最適化は準最適になります。
したがって、教師なしクラスタリングと低教師ありグラフベースの分類の間のスムーズな移行を得たいと考えています。
この論文では、半教師あり学習 (SSL) 問題に適応した新しいタイプのグラフ ラプラシアンを提案します。
これは、密度測定とコントラスト測定の両方に基づいており、ラベル付けされたデータをオペレータで直接エンコードできます。
したがって、スペクトル クラスタリングを使用して、半教師あり学習を正常に実行できます。
私たちのアプローチの利点は、いくつかの SSL の問題で示されています。
要約(オリジナル)
Semi-supervised learning is highly useful in common scenarios where labeled data is scarce but unlabeled data is abundant. The graph (or nonlocal) Laplacian is a fundamental smoothing operator for solving various learning tasks. For unsupervised clustering, a spectral embedding is often used, based on graph-Laplacian eigenvectors. For semi-supervised problems, the common approach is to solve a constrained optimization problem, regularized by a Dirichlet energy, based on the graph-Laplacian. However, as supervision decreases, Dirichlet optimization becomes suboptimal. We therefore would like to obtain a smooth transition between unsupervised clustering and low-supervised graph-based classification. In this paper, we propose a new type of graph-Laplacian which is adapted for Semi-Supervised Learning (SSL) problems. It is based on both density and contrastive measures and allows the encoding of the labeled data directly in the operator. Thus, we can perform successfully semi-supervised learning using spectral clustering. The benefits of our approach are illustrated for several SSL problems.
arxiv情報
著者 | Or Streicher,Guy Gilboa |
発行日 | 2023-01-12 12:02:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google