TouchUp-G: Improving Feature Representation through Graph-Centric Finetuning

要約

事前トレーニング済みモデル (PM) から取得したノードの機能を強化して、下流のグラフ学習タスクに適したものにするにはどうすればよいでしょうか?
グラフ ニューラル ネットワーク (GNN) は、多くの影響力の高い現実世界のグラフ アプリケーションにとって最先端のアプローチとなっています。
特徴が豊富なグラフの場合、ドメイン適応技術を組み込むことなく、PM を直接利用して特徴を生成することが一般的です。
それにもかかわらず、PM から抽出されたノードの特徴はグラフに依存せず、GNN がグラフ構造とノードの特徴の間の潜在的な相関を十分に活用することができず、GNN のパフォーマンスの低下につながるため、この方法は次善の策です。
この研究では、ダウンストリーム グラフ タスク用に PM から取得したノード機能の改善を目指し、いくつかの利点がある TOUCHUP-G を導入します。
これは (a) 一般: レコメンダー システムでよく使用されるリンク予測を含む、あらゆる下流のグラフ タスクに適用できます。
(b) マルチモーダル: あらゆるモダリティ (画像、テキスト、オーディオなど) の生の機能を改善できます。
(c) 原理: これは、グラフ構造とノードの特徴の間の潜在的な相関関係を定量化するために私たちが提案する新しいメトリックである特徴の相同性と密接に関連しており、TOUCHUP-G がグラフ構造とノードの間の不一致を効果的に縮小できることを示しています。
特徴;
(d) 効果的: さまざまなタスクとモダリティにわたる 4 つの現実世界のデータセットで最先端の結果を達成します。

要約(オリジナル)

How can we enhance the node features acquired from Pretrained Models (PMs) to better suit downstream graph learning tasks? Graph Neural Networks (GNNs) have become the state-of-the-art approach for many high-impact, real-world graph applications. For feature-rich graphs, a prevalent practice involves utilizing a PM directly to generate features, without incorporating any domain adaptation techniques. Nevertheless, this practice is suboptimal because the node features extracted from PM are graph-agnostic and prevent GNNs from fully utilizing the potential correlations between the graph structure and node features, leading to a decline in GNNs performance. In this work, we seek to improve the node features obtained from a PM for downstream graph tasks and introduce TOUCHUP-G, which has several advantages. It is (a) General: applicable to any downstream graph task, including link prediction which is often employed in recommender systems; (b) Multi-modal: able to improve raw features of any modality (e.g. images, texts, audio); (c) Principled: it is closely related to a novel metric, feature homophily, which we propose to quantify the potential correlations between the graph structure and node features and we show that TOUCHUP-G can effectively shrink the discrepancy between the graph structure and node features; (d) Effective: achieving state-of-the-art results on four real-world datasets spanning different tasks and modalities.

arxiv情報

著者 Jing Zhu,Xiang Song,Vassilis N. Ioannidis,Danai Koutra,Christos Faloutsos
発行日 2023-09-25 05:44:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.SI パーマリンク