$\mathcal{G}^2Pxy$: Generative Open-Set Node Classification on Graphs with Proxy Unknowns

要約

ノード分類は、グラフ内のラベルのないノードのラベルを予測するタスクです。
グラフ ニューラル ネットワークに基づく最先端の手法は、トレーニング中にすべてのラベルが利用可能な場合に優れたパフォーマンスを実現します。
しかし実際には、新しいクラスを含むデータにモデルが適用されることが多く、これにより大規模な誤分類が発生し、パフォーマンスが大幅に低下する可能性があります。
したがって、特定のサンプルが既知のクラスに属するかどうかを判断するには、オープンセット分類法の開発が重要です。
開集合ノード分類の既存の方法は、一般に、実際の目に見えないクラス ノードの特徴の一部またはすべてを用いた変換学習を使用して、開集合分類を支援します。
この論文では、新しい生成的開集合ノード分類法、つまり $\mathcal{G}^2Pxy$ を提案します。これは、トレーニングと検証中に未知のクラスに関する情報が利用できない、より厳密な帰納学習設定に従います。
新しいクラスの分布を効率的に予測するために、クラス間未知プロキシと外部未知プロキシの 2 種類のプロキシ未知ノードがミックスアップによって生成されます。
生成されたプロキシを使用すると、追加のプロキシ分類子で拡張することにより、閉集合分類子を開集合分類子に変換できます。
交差エントロピー損失と補エントロピー損失の両方の制約の下で、$\mathcal{G}^2Pxy$ は未知のクラスの検出と既知のクラス分類に対して優れた効果を達成します。これはベンチマーク グラフ データセットの実験によって検証されています。
さらに、$\mathcal{G}^2Pxy$ には GNN アーキテクチャに関する特定の要件がなく、適切な一般化が示されています。

要約(オリジナル)

Node classification is the task of predicting the labels of unlabeled nodes in a graph. State-of-the-art methods based on graph neural networks achieve excellent performance when all labels are available during training. But in real-life, models are often applied on data with new classes, which can lead to massive misclassification and thus significantly degrade performance. Hence, developing open-set classification methods is crucial to determine if a given sample belongs to a known class. Existing methods for open-set node classification generally use transductive learning with part or all of the features of real unseen class nodes to help with open-set classification. In this paper, we propose a novel generative open-set node classification method, i.e. $\mathcal{G}^2Pxy$, which follows a stricter inductive learning setting where no information about unknown classes is available during training and validation. Two kinds of proxy unknown nodes, inter-class unknown proxies and external unknown proxies are generated via mixup to efficiently anticipate the distribution of novel classes. Using the generated proxies, a closed-set classifier can be transformed into an open-set one, by augmenting it with an extra proxy classifier. Under the constraints of both cross entropy loss and complement entropy loss, $\mathcal{G}^2Pxy$ achieves superior effectiveness for unknown class detection and known class classification, which is validated by experiments on benchmark graph datasets. Moreover, $\mathcal{G}^2Pxy$ does not have specific requirement on the GNN architecture and shows good generalizations.

arxiv情報

著者 Qin Zhang,Zelin Shi,Xiaolin Zhang,Xiaojun Chen,Philippe Fournier-Viger,Shirui Pan
発行日 2023-08-10 09:42:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク