Disentangling the Potential Impacts of Papers into Diffusion, Conformity, and Contribution Values

要約

学術論文の潜在的な影響は、その人気や貢献度などのさまざまな要因によって決まります。
既存のモデルは通常、静的なグラフに基づいて元の引用数を推定しており、微妙な観点から値を区別することができません。
この研究では、論文の潜在的な影響を拡散、適合性、貢献の値に分解するための新しいグラフ ニューラル ネットワーク (DPPDCC と呼ばれます) を提案します。
ターゲット論文が与えられると、DPPDCC は構築された動的異種グラフ内の時間的および構造的特徴をエンコードします。
特に、知識の流れを把握するために、論文間の比較および共引用/引用情報と進化的に集約されたスナップショットの重要性を強調します。
人気を解明するために、拡張グラフを対比して拡散の本質を抽出し、モデルの適合性に対する蓄積された引用ビニングを予測します。
さらに直交制約を適用して、各視点の個別のモデリングを促進し、貢献の固有の価値を維持します。
さまざまな時期に発表された論文のモデルの一般化を評価するために、現実世界の状況を反映するために特定の時点に基づいてデータを分割することによって問題を再定式化します。
3 つのデータセットに関する広範な実験結果は、DPPDCC が以前に出版された論文、新しく出版された論文、および出版直後の論文のベースラインを大幅に上回っていることを示しています。
さらなる分析により、その堅牢な機能が確認されています。
データセットとコードを公開します。

要約(オリジナル)

The potential impact of an academic paper is determined by various factors, including its popularity and contribution. Existing models usually estimate original citation counts based on static graphs and fail to differentiate values from nuanced perspectives. In this study, we propose a novel graph neural network to Disentangle the Potential impacts of Papers into Diffusion, Conformity, and Contribution values (called DPPDCC). Given a target paper, DPPDCC encodes temporal and structural features within the constructed dynamic heterogeneous graph. Particularly, to capture the knowledge flow, we emphasize the importance of comparative and co-cited/citing information between papers and aggregate snapshots evolutionarily. To unravel popularity, we contrast augmented graphs to extract the essence of diffusion and predict the accumulated citation binning to model conformity. We further apply orthogonal constraints to encourage distinct modeling of each perspective and preserve the inherent value of contribution. To evaluate models’ generalization for papers published at various times, we reformulate the problem by partitioning data based on specific time points to mirror real-world conditions. Extensive experimental results on three datasets demonstrate that DPPDCC significantly outperforms baselines for previously, freshly, and immediately published papers. Further analyses confirm its robust capabilities. We will make our datasets and codes publicly available.

arxiv情報

著者 Zhikai Xue,Guoxiu He,Zhuoren Jiang,Sichen Gu,Yangyang Kang,Star Zhao,Wei Lu
発行日 2024-01-18 17:38:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.SI パーマリンク