Graph-level Protein Representation Learning by Structure Knowledge Refinement

要約

この論文は、教師なしの方法でグラフ全体のレベルで表現を学習することに焦点を当てています。
グラフレベルの表現の学習は、分子特性の予測、タンパク質構造の特徴抽出、ソーシャルネットワーク分析など、現実世界のさまざまな問題において重要な役割を果たします。
主流の方法は、グラフ対照学習 (GCL) として知られる、グラフの特徴抽出を容易にするために対照学習を利用することです。
GCL は効果的ではありますが、対比学習では偽陰性ペアの影響など、いくつかの複雑な問題があります。
さらに、GCL の拡張戦略は、多様なグラフ データセットへの適応性が低くなります。
これらの問題を動機として、データ構造を使用してペアが正であるか負であるかの確率を決定する構造知識改良 (SKR) と呼ばれる新しいフレームワークを提案します。
一方、私たちは、元のデータの意味論的な意味を自然に保存し、SKR フレームワークと互換性のある拡張戦略を提案します。
さらに、直観と実験を通じて、SKR フレームワークの有効性を説明します。
グラフレベル分類のタスクに関する実験結果は、SKR フレームワークがほとんどの最先端のベースラインよりも優れていることを示しています。

要約(オリジナル)

This paper focuses on learning representation on the whole graph level in an unsupervised manner. Learning graph-level representation plays an important role in a variety of real-world issues such as molecule property prediction, protein structure feature extraction, and social network analysis. The mainstream method is utilizing contrastive learning to facilitate graph feature extraction, known as Graph Contrastive Learning (GCL). GCL, although effective, suffers from some complications in contrastive learning, such as the effect of false negative pairs. Moreover, augmentation strategies in GCL are weakly adaptive to diverse graph datasets. Motivated by these problems, we propose a novel framework called Structure Knowledge Refinement (SKR) which uses data structure to determine the probability of whether a pair is positive or negative. Meanwhile, we propose an augmentation strategy that naturally preserves the semantic meaning of the original data and is compatible with our SKR framework. Furthermore, we illustrate the effectiveness of our SKR framework through intuition and experiments. The experimental results on the tasks of graph-level classification demonstrate that our SKR framework is superior to most state-of-the-art baselines.

arxiv情報

著者 Ge Wang,Zelin Zang,Jiangbin Zheng,Jun Xia,Stan Z. Li
発行日 2024-01-05 09:05:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, q-bio.BM パーマリンク