Graph Laplacian for Semi-Supervised Learning

要約

タイトル:グラフラプラシアンを用いた半教師あり学習

要約:
– ラベルつきデータが少なく、ラベルなしデータが多い状況において、半教師あり学習は非常に有用である。
– グラフラプラシアンは、様々な学習タスクを解くための基本的なスムージングオペレータである。
– 一般的には、グラフラプラシアンの固有ベクトルに基づくスペクトル埋め込みが、非教師ありクラスタリングに使用される。
– 一方、半教師あり問題では、グラフラプラシアンに基づくディリクレエネルギーによる制約最適化問題を解くことが一般的である。
– しかし、監視が減少するにつれて、ディリクレ最適化はサブオプティマルになる傾向があるため、非常に少ない監視の下でのグラフベースの分類にスムーズな移行が必要である。
– そこで、本論文では、密度と対比測度の両方に基づく、新しいタイプの半教師あり学習向けグラフラプラシアンを提案する。このグラフラプラシアンは、ラベルデータをオペレータに直接エンコードすることができるため、スペクトルクラスタリングを使用して半教師あり学習を成功させることができる。
– このアプローチの利点は、いくつかの半教師あり学習問題について説明されている。

要約(オリジナル)

Semi-supervised learning is highly useful in common scenarios where labeled data is scarce but unlabeled data is abundant. The graph (or nonlocal) Laplacian is a fundamental smoothing operator for solving various learning tasks. For unsupervised clustering, a spectral embedding is often used, based on graph-Laplacian eigenvectors. For semi-supervised problems, the common approach is to solve a constrained optimization problem, regularized by a Dirichlet energy, based on the graph-Laplacian. However, as supervision decreases, Dirichlet optimization becomes suboptimal. We therefore would like to obtain a smooth transition between unsupervised clustering and low-supervised graph-based classification. In this paper, we propose a new type of graph-Laplacian which is adapted for Semi-Supervised Learning (SSL) problems. It is based on both density and contrastive measures and allows the encoding of the labeled data directly in the operator. Thus, we can perform successfully semi-supervised learning using spectral clustering. The benefits of our approach are illustrated for several SSL problems.

arxiv情報

著者 Or Streicher,Guy Gilboa
発行日 2023-04-19 12:51:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV, cs.LG, eess.SP パーマリンク