要約
グラフのノード分類は、しばしばクラスの不均衡に苦しみ、偏った予測と実際のアプリケーションの重大なリスクにつながります。
データ中心のソリューションは調査されていますが、テキストアトリブされたグラフ(タグ)と、少数型ノードの分類を改善するために豊富なテキストセマンティクスを使用する可能性をほとんど見落としています。
このギャップを考慮して、不均衡なノード分類を処理するために大規模な言語モデル(LLM)を活用する新しいフレームワークである、テキストアトリブグラフ(LA-TAG)の大規模な言語モデルベースの増強を提案します。
具体的には、テキストノード属性を合成するための補間に触発されたプロンプト戦略を開発します。
さらに、合成ノードをグラフ構造に効果的に統合するために、生成されたノードを元のグラフに接続するテキストリンク予測子を導入し、構造情報とコンテキスト情報を保存します。
さまざまなデータセットと評価メトリックの実験は、LAタグが既存のテキスト増強とグラフの不均衡学習方法を上回ることを示しており、タグのクラスの不均衡に対処する際のアプローチの有効性を強調しています。
要約(オリジナル)
Node classification on graphs often suffers from class imbalance, leading to biased predictions and significant risks in real-world applications. While data-centric solutions have been explored, they largely overlook Text-Attributed Graphs (TAGs) and the potential of using rich textual semantics to improve the classification of minority nodes. Given this gap, we propose Large Language Model-based Augmentation on Text-Attributed Graphs (LA-TAG), a novel framework that leverages Large Language Models (LLMs) to handle imbalanced node classification. Specifically, we develop prompting strategies inspired by interpolation to synthesize textual node attributes. Additionally, to effectively integrate synthetic nodes into the graph structure, we introduce a textual link predictor that connects the generated nodes to the original graph, preserving structural and contextual information. Experiments across various datasets and evaluation metrics demonstrate that LA-TAG outperforms existing textual augmentation and graph imbalance learning methods, emphasizing the efficacy of our approach in addressing class imbalance in TAGs.
arxiv情報
著者 | Leyao Wang,Yu Wang,Bo Ni,Yuying Zhao,Tyler Derr |
発行日 | 2025-01-27 17:06:48+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google