ROG$_{PL}$: Robust Open-Set Graph Learning via Region-Based Prototype Learning

要約

開集合グラフ学習は、既知のクラス ノードを分類し、未知のクラス サンプルを未知のものとして識別することを目的とした実用的なタスクです。
従来のノード分類方法は、通常、分布外 (OOD) データや分布内 (IND) ノイズなどの複雑なデータに遭遇するため、オープンセット シナリオでは満足のいくパフォーマンスが得られません。
OOD データは、既知のクラスに属さないサンプルです。
トレーニング中に発生した場合は外れ値 (OOD ノイズ)、テスト中に発生した場合はオープンセット サンプルとなります。
IND ノイズは、誤ったラベルが割り当てられたトレーニング サンプルです。
IND ノイズと OOD ノイズの存在は一般的であり、通常、クラス内の多様性問題やクラス間の混乱問題などのあいまいさの問題を引き起こします。
したがって、堅牢なオープンセット学習方法を探索することは必要かつ困難であり、非 IID グラフ データの場合はさらに困難になります。この目的のために、我々は堅牢なオープンセットを実現する ROG$_{PL}$ という名前の統合フレームワークを提案します。
プロトタイプ学習を導入することで、複雑なノイズのあるグラフ データに学習を設定します。
具体的には、ROG$_{PL}$ は、ラベル伝播によるノイズ除去と領域による開集合プロトタイプ学習の 2 つのモジュールで構成されています。
最初のモジュールは、類似性に基づくラベル伝播を通じてノイズのあるラベルを修正し、信頼性の低いサンプルを削除して、ノイズによって引き起こされるクラス内多様性の問題を解決します。
2 番目のモジュールは、非重複領域を介して既知の各クラスの開集合プロトタイプを学習し、クラス間の混乱の問題を解決するために内部プロトタイプと境界プロトタイプの両方を維持します。2 つのモジュールは、分類損失とプロトタイプ多様性損失の制約の下で反復的に更新されます。
私たちの知る限り、提案された ROG$_{PL}$ は、複雑なノイズを含むグラフ データに対する最初の堅牢な開集合ノード分類法です。

要約(オリジナル)

Open-set graph learning is a practical task that aims to classify the known class nodes and to identify unknown class samples as unknowns. Conventional node classification methods usually perform unsatisfactorily in open-set scenarios due to the complex data they encounter, such as out-of-distribution (OOD) data and in-distribution (IND) noise. OOD data are samples that do not belong to any known classes. They are outliers if they occur in training (OOD noise), and open-set samples if they occur in testing. IND noise are training samples which are assigned incorrect labels. The existence of IND noise and OOD noise is prevalent, which usually cause the ambiguity problem, including the intra-class variety problem and the inter-class confusion problem. Thus, to explore robust open-set learning methods is necessary and difficult, and it becomes even more difficult for non-IID graph data.To this end, we propose a unified framework named ROG$_{PL}$ to achieve robust open-set learning on complex noisy graph data, by introducing prototype learning. In specific, ROG$_{PL}$ consists of two modules, i.e., denoising via label propagation and open-set prototype learning via regions. The first module corrects noisy labels through similarity-based label propagation and removes low-confidence samples, to solve the intra-class variety problem caused by noise. The second module learns open-set prototypes for each known class via non-overlapped regions and remains both interior and border prototypes to remedy the inter-class confusion problem.The two modules are iteratively updated under the constraints of classification loss and prototype diversity loss. To the best of our knowledge, the proposed ROG$_{PL}$ is the first robust open-set node classification method for graph data with complex noise.

arxiv情報

著者 Qin Zhang,Xiaowei Li,Jiexin Lu,Liping Qiu,Shirui Pan,Xiaojun Chen,Junyang Chen
発行日 2024-02-28 17:25:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク