NoisyGL: A Comprehensive Benchmark for Graph Neural Networks under Label Noise

要約

グラフ ニューラル ネットワーク (GNN) は、メッセージ パッシング メカニズムを通じてノード分類タスクにおいて強力な可能性を示します。
ただし、そのパフォーマンスは高品質のノード ラベルに依存することが多く、信頼性の低いソースや敵対的な攻撃のため、実際のシナリオでは取得が困難です。
その結果、ラベル ノイズは現実世界のグラフ データによく見られ、トレーニング中に誤った情報を伝播することで GNN に悪影響を及ぼします。
この問題に対処するために、ラベル ノイズ (GLN) の下でのグラフ ニューラル ネットワークの研究が最近注目を集めています。
ただし、データセットの選択、データ分割、および前処理技術にばらつきがあるため、コミュニティには現在、包括的なベンチマークが不足しており、GLN のより深い理解とさらなる開発が妨げられています。
このギャップを埋めるために、本稿では、ラベル ノイズ下でのグラフ ニューラル ネットワークの最初の包括的なベンチマークである NoisyGL を紹介します。
NoisyGL を使用すると、統合された実験設定とインターフェイスを使用して、さまざまなデータセットにわたるノイズの多いラベル付きグラフ データに対する GLN メソッドの公正な比較と詳細な分析が可能になります。
私たちのベンチマークは、以前の研究では見逃されていたいくつかの重要な洞察を明らかにしており、これらの発見は将来の研究に非常に有益であると信じています。
私たちは、オープンソースのベンチマーク ライブラリがこの分野のさらなる進歩を促進することを願っています。
ベンチマークのコードは https://github.com/eaglelab-zju/NoisyGL にあります。

要約(オリジナル)

Graph Neural Networks (GNNs) exhibit strong potential in node classification task through a message-passing mechanism. However, their performance often hinges on high-quality node labels, which are challenging to obtain in real-world scenarios due to unreliable sources or adversarial attacks. Consequently, label noise is common in real-world graph data, negatively impacting GNNs by propagating incorrect information during training. To address this issue, the study of Graph Neural Networks under Label Noise (GLN) has recently gained traction. However, due to variations in dataset selection, data splitting, and preprocessing techniques, the community currently lacks a comprehensive benchmark, which impedes deeper understanding and further development of GLN. To fill this gap, we introduce NoisyGL in this paper, the first comprehensive benchmark for graph neural networks under label noise. NoisyGL enables fair comparisons and detailed analyses of GLN methods on noisy labeled graph data across various datasets, with unified experimental settings and interface. Our benchmark has uncovered several important insights that were missed in previous research, and we believe these findings will be highly beneficial for future studies. We hope our open-source benchmark library will foster further advancements in this field. The code of the benchmark can be found in https://github.com/eaglelab-zju/NoisyGL.

arxiv情報

著者 Zhonghao Wang,Danyu Sun,Sheng Zhou,Haobo Wang,Jiapei Fan,Longtao Huang,Jiajun Bu
発行日 2024-06-06 17:45:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.SI パーマリンク