要約
グラフ分類は、画像、ビデオ、ソーシャルネットワークなどの様々なマルチメディアデータをグラフで表現することができる、多くの実世界マルチメディアアプリケーションにおいて重要なタスクである。これまでの取り組みでは、グラフニューラルネットワーク(GNN)は、クラス分布のバランスが取れた状況で適用されてきた。しかし、実世界のデータは一般的に長尾型のクラス分布を示し、その結果、GNNを使用した場合、先頭クラスへの偏りが生じ、末尾クラスに対する汎化能力が制限される。最近のアプローチは、モデル学習中に異なるクラスのバランスを取り直すことに主眼を置いているが、これは新しい知識を明示的に導入できず、先頭クラスの性能を犠牲にしている。このような欠点に対処するため、我々はRetrieval Augmented Hybrid Network (RAHNet)と呼ばれる新しいフレームワークを提案し、ロバストな特徴抽出器と非バイアス分類器を非連続的に学習する。特徴抽出器の学習段階では、テールクラスのクラス内多様性を直接的に豊かにする関連グラフを検索するグラフ検索モジュールを開発する。さらに、ロングテールのシナリオにより適した識別表現を得るために、カテゴリ中心の教師付き対比損失を革新的に最適化する。分類器の微調整の段階では、2つの重み正則化手法、すなわち最大正規化と重み減衰を用いて、分類器の重みのバランスをとる。様々な一般的なベンチマークを用いた実験により、最新のアプローチに対する提案手法の優位性を検証する。
要約(オリジナル)
Graph classification is a crucial task in many real-world multimedia applications, where graphs can represent various multimedia data types such as images, videos, and social networks. Previous efforts have applied graph neural networks (GNNs) in balanced situations where the class distribution is balanced. However, real-world data typically exhibit long-tailed class distributions, resulting in a bias towards the head classes when using GNNs and limited generalization ability over the tail classes. Recent approaches mainly focus on re-balancing different classes during model training, which fails to explicitly introduce new knowledge and sacrifices the performance of the head classes. To address these drawbacks, we propose a novel framework called Retrieval Augmented Hybrid Network (RAHNet) to jointly learn a robust feature extractor and an unbiased classifier in a decoupled manner. In the feature extractor training stage, we develop a graph retrieval module to search for relevant graphs that directly enrich the intra-class diversity for the tail classes. Moreover, we innovatively optimize a category-centered supervised contrastive loss to obtain discriminative representations, which is more suitable for long-tailed scenarios. In the classifier fine-tuning stage, we balance the classifier weights with two weight regularization techniques, i.e., Max-norm and weight decay. Experiments on various popular benchmarks verify the superiority of the proposed method against state-of-the-art approaches.
arxiv情報
著者 | Zhengyang Mao,Wei Ju,Yifang Qin,Xiao Luo,Ming Zhang |
発行日 | 2023-08-04 14:06:44+00:00 |
arxivサイト | arxiv_id(pdf) |