Class-Balanced and Reinforced Active Learning on Graphs

要約

グラフ ニューラル ネットワーク (GNN) は、ノード分類、リンク予測、グラフ分類などのさまざまなアプリケーションで大きな成功を収めています。
GNN のアクティブ ラーニングは、ラベルのないデータから貴重なサンプルをクエリして注釈を付け、低コストで GNN のパフォーマンスを最大化することを目的としています。
ただし、GNN で強化された能動学習用の既存のアルゴリズムのほとんどは、特に非常に偏ったクラス シナリオでは、非常に不均衡なクラス分布を引き起こす可能性があります。
クラス不均衡なラベル付きデータを使用してトレーニングされた GNN は、多数派クラスへのバイアスの影響を受けやすく、少数派クラスのパフォーマンスの低下が全体的なパフォーマンスの低下につながる可能性があります。
この問題に取り組むために、私たちは、GNN 用の新しいクラスバランスの強化されたアクティブ ラーニング フレームワーク、つまり GCBR を提案します。
アノテーション用にクラスバランスの取れた情報ノードを取得するための最適なポリシーを学習し、選択されたラベル付きノードでトレーニングされた GNN のパフォーマンスを最大化します。
GCBR は、クラス バランスを意識した状態と、モデルのパフォーマンスとクラス バランスの間のトレードオフを達成する報酬関数を設計します。
強化学習アルゴリズムAdvantage Actor-Critic(A2C)を採用し、最適なポリシーを安定かつ効率的に学習します。
よりクラスバランスのとれたラベル付きセットを取得するための罰メカニズムを導入することにより、GCBR を GCBR++ にさらにアップグレードします。
複数のデータセットに対する広範な実験により、提案されたアプローチの有効性が実証され、最先端のベースラインを上回る優れたパフォーマンスが達成されました。

要約(オリジナル)

Graph neural networks (GNNs) have demonstrated significant success in various applications, such as node classification, link prediction, and graph classification. Active learning for GNNs aims to query the valuable samples from the unlabeled data for annotation to maximize the GNNs’ performance at a lower cost. However, most existing algorithms for reinforced active learning in GNNs may lead to a highly imbalanced class distribution, especially in highly skewed class scenarios. GNNs trained with class-imbalanced labeled data are susceptible to bias toward majority classes, and the lower performance of minority classes may lead to a decline in overall performance. To tackle this issue, we propose a novel class-balanced and reinforced active learning framework for GNNs, namely, GCBR. It learns an optimal policy to acquire class-balanced and informative nodes for annotation, maximizing the performance of GNNs trained with selected labeled nodes. GCBR designs class-balance-aware states, as well as a reward function that achieves trade-off between model performance and class balance. The reinforcement learning algorithm Advantage Actor-Critic (A2C) is employed to learn an optimal policy stably and efficiently. We further upgrade GCBR to GCBR++ by introducing a punishment mechanism to obtain a more class-balanced labeled set. Extensive experiments on multiple datasets demonstrate the effectiveness of the proposed approaches, achieving superior performance over state-of-the-art baselines.

arxiv情報

著者 Chengcheng Yu,Jiapeng Zhu,Xiang Li
発行日 2024-02-19 15:08:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク