Characterizing Graph Datasets for Node Classification: Homophily-Heterophily Dichotomy and Beyond

要約

同類性とは、エッジが類似したノードを接続する傾向を表すグラフ特性であり、その反対は異類性と呼ばれる。異相グラフは標準的なメッセージパッシンググラフニューラルネットワーク(GNN)にとって困難であるとしばしば考えられており、この設定のための効率的な手法の開発に多くの努力が払われてきた。しかし、文献上では同類性の普遍的に合意された尺度は存在しない。本研究では、一般的に用いられている同類性の尺度には、異なるデータセット間で同類性のレベルを比較することを妨げる重大な欠点があることを示す。そのために、適切なホモフィリー尺度の望ましい性質を定式化し、どの尺度がどの性質を満たすかを検証する。特に、グラフ機械学習の文献ではほとんど使われていないが、我々がadjusted homophilyと呼ぶ尺度が、他の一般的なホモフィリー尺度よりも望ましい特性を満たすことを示す。そして、同類性と異類性の二項対立を超え、異類性をさらに区別できる新しい特性を提案する。提案するラベル情報量(LI)は、ノードのラベルについて、近傍のラベルがどれだけの情報を提供するかを特徴付ける。我々はこの尺度が重要な望ましい性質を満たすことを証明する。また、LIは同類性の尺度と比較してGNNの性能と良く一致することを経験的に観測し、グラフ構造の有用な特性であることを確認する。

要約(オリジナル)

Homophily is a graph property describing the tendency of edges to connect similar nodes; the opposite is called heterophily. It is often believed that heterophilous graphs are challenging for standard message-passing graph neural networks (GNNs), and much effort has been put into developing efficient methods for this setting. However, there is no universally agreed-upon measure of homophily in the literature. In this work, we show that commonly used homophily measures have critical drawbacks preventing the comparison of homophily levels across different datasets. For this, we formalize desirable properties for a proper homophily measure and verify which measures satisfy which properties. In particular, we show that a measure that we call adjusted homophily satisfies more desirable properties than other popular homophily measures while being rarely used in graph machine learning literature. Then, we go beyond the homophily-heterophily dichotomy and propose a new characteristic that allows one to further distinguish different sorts of heterophily. The proposed label informativeness (LI) characterizes how much information a neighbor’s label provides about a node’s label. We prove that this measure satisfies important desirable properties. We also observe empirically that LI better agrees with GNN performance compared to homophily measures, which confirms that it is a useful characteristic of the graph structure.

arxiv情報

著者 Oleg Platonov,Denis Kuznedelev,Artem Babenko,Liudmila Prokhorenkova
発行日 2024-03-02 22:01:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.DM, cs.LG, cs.SI, math.PR パーマリンク