要約
グラフ・ニューラル・ネットワーク(GNN)は、データ・ラベルから学習し、ノードの近傍内のメッセージを集約するという核となるアイデアにより、様々なタスクで優れた性能を示してきた。しかし、グラフに共通する課題は2つある:正確(高品質)なラベルが不十分であることと、ノードの近傍が限られているため、GNNが弱いことである。既存のグラフ補強手法は、一般的にこれらの課題の一方にしか対処しておらず、多くの場合、学習コストを追加したり、過度に単純化された戦略や知識集約的な戦略に依存しており、汎化が制限されている。一般化された方法でグラフが直面する両方の課題に同時に対処するために、我々はIntraMixと呼ばれるエレガントな手法を提案する。グラフの複雑なトポロジーとバニラのMixupの相性の悪さを考慮し、IntraMixは革新的に、同じクラスの不正確なラベル付きデータの間でMixupを採用し、最小限のコストで高品質のラベル付きデータを生成する。さらに、生成されたデータと同じグループにクラスタ化される信頼性の高いデータを発見し、それらの近傍データとして利用することで、グラフの近傍領域を豊かにする。IntraMixは、グラフが直面する両方の問題に効率的に取り組み、ノード分類におけるMixupの有効性が限定的であるという従来の概念に挑戦する。IntraMixは理論的に根拠のあるプラグインプレイ手法であり、全てのGNNに容易に適用できる。広範な実験により、様々なGNNとデータセットにおけるIntraMixの有効性が実証されている。我々のコードはhttps://github.com/Zhengsh123/IntraMix。
要約(オリジナル)
Graph Neural Networks (GNNs) have shown great performance in various tasks, with the core idea of learning from data labels and aggregating messages within the neighborhood of nodes. However, the common challenges in graphs are twofold: insufficient accurate (high-quality) labels and limited neighbors for nodes, resulting in weak GNNs. Existing graph augmentation methods typically address only one of these challenges, often adding training costs or relying on oversimplified or knowledge-intensive strategies, limiting their generalization. To simultaneously address both challenges faced by graphs in a generalized way, we propose an elegant method called IntraMix. Considering the incompatibility of vanilla Mixup with the complex topology of graphs, IntraMix innovatively employs Mixup among inaccurate labeled data of the same class, generating high-quality labeled data at minimal cost. Additionally, it finds data with high confidence of being clustered into the same group as the generated data to serve as their neighbors, thereby enriching the neighborhoods of graphs. IntraMix efficiently tackles both issues faced by graphs and challenges the prior notion of the limited effectiveness of Mixup in node classification. IntraMix is a theoretically grounded plug-in-play method that can be readily applied to all GNNs. Extensive experiments demonstrate the effectiveness of IntraMix across various GNNs and datasets. Our code is available at: https://github.com/Zhengsh123/IntraMix.
arxiv情報
著者 | Shenghe Zheng,Hongzhi Wang,Xianglong Liu |
発行日 | 2024-11-01 03:51:18+00:00 |
arxivサイト | arxiv_id(pdf) |