A Safe Semi-supervised Graph Convolution Network

要約

半教師付き学習の分野では,GNN の変形モデルである Graph Convolution Network (GCN) が, GNN に畳み込みを導入することにより,非ユークリッドデータに対して有望な結果を得ている.しかし,GCNとその変形モデルは,リスクラベルのないデータの情報を安全に利用することができず,半教師付き学習の性能を低下させることになります.そこで、我々は学習性能を向上させるために、安全なGCNフレームワーク(Safe-GCN)を提案します。Safe-GCNでは、未ラベルデータにラベルを付けるための反復処理を設計します。各反復において、GCNとその教師版(S-GCN)を学習し、高い信頼度でラベル付けされた未ラベルデータを発見する。そして、信頼度の高い未ラベルデータとその擬似ラベルをラベル集合に追加する。最後に、追加されたラベル無しデータとラベル付きデータの両方を用いて、S-GCNを学習する。この学習により、リスクのあるラベル無しデータを安全に探索し、大量のラベル無しデータを安全に利用できるようになる。Safe-GCNの性能を3つの有名な引用ネットワークデータセットで評価し、得られた結果から、提案フレームワークがいくつかのグラフベースの半教師付き学習手法に対して有効であることを示す。

要約(オリジナル)

In the semi-supervised learning field, Graph Convolution Network (GCN), as a variant model of GNN, has achieved promising results for non-Euclidean data by introducing convolution into GNN. However, GCN and its variant models fail to safely use the information of risk unlabeled data, which will degrade the performance of semi-supervised learning. Therefore, we propose a Safe GCN framework (Safe-GCN) to improve the learning performance. In the Safe-GCN, we design an iterative process to label the unlabeled data. In each iteration, a GCN and its supervised version(S-GCN) are learned to find the unlabeled data with high confidence. The high-confidence unlabeled data and their pseudo labels are then added to the label set. Finally, both added unlabeled data and labeled ones are used to train a S-GCN which can achieve the safe exploration of the risk unlabeled data and enable safe use of large numbers of unlabeled data. The performance of Safe-GCN is evaluated on three well-known citation network datasets and the obtained results demonstrate the effectiveness of the proposed framework over several graph-based semi-supervised learning methods.

arxiv情報

著者 Zhi Yang,Yadong Yan,Haitao Gan,Jing Zhao,Zhiwei Ye
発行日 2022-07-05 11:03:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG パーマリンク