要約
動的ノード分類は、金融取引や学術的コラボレーションなどの進化するシステムをモデリングするために重要です。
このようなシステムでは、動的なノード情報の変更を動的にキャプチャすることは、通常、すべてのタイムスタンプですべてのラベルを必要とする動的ノード分類にとって重要です。
ただし、注釈コストが高く、ラベルの不確実性(詐欺検出の曖昧または遅延ラベル)のために、実際のシナリオですべての動的ラベルを収集することは困難です。
対照的に、最終的なタイムスタンプラベルは、完全な時間パターンに依存しているため、取得が簡単で、通常、履歴データを追跡せずに、多くのオープンプラットフォームで各ユーザーのユニークなラベルとして維持されます。
このギャップを埋めるために、最終ラベルのみが利用可能なラベル制限動的ノード分類に対処する先駆的な方法であるPTCL(擬似ラベル時間カリキュラム学習)を提案します。
PTCLは、次のように導入します。(1)バックボーン(時間を取得した表現の学習)とデコーダー(最終ラベルと厳密に整合した)を分離する時間的分離アーキテクチャ、擬似ラベルを生成します。
新しいアカデミックデータセット(COOAG)を提供し、動的グラフで長距離の研究関心をキャプチャします。
実際のシナリオ全体の実験は、このタスクに適応した他の方法に対するPTCLの一貫した優位性を示しています。
方法論を超えて、完全な準備ワークフロー、トレーニングパイプライン、評価基準で構成される統一フレームワークFLID(ラベル制限された動的ノード分類のフレームワーク)を提案し、さまざまなモデルとデータセットをサポートします。
コードはhttps://github.com/3205914485/flidにあります。
要約(オリジナル)
Dynamic node classification is critical for modeling evolving systems like financial transactions and academic collaborations. In such systems, dynamically capturing node information changes is critical for dynamic node classification, which usually requires all labels at every timestamp. However, it is difficult to collect all dynamic labels in real-world scenarios due to high annotation costs and label uncertainty (e.g., ambiguous or delayed labels in fraud detection). In contrast, final timestamp labels are easier to obtain as they rely on complete temporal patterns and are usually maintained as a unique label for each user in many open platforms, without tracking the history data. To bridge this gap, we propose PTCL(Pseudo-label Temporal Curriculum Learning), a pioneering method addressing label-limited dynamic node classification where only final labels are available. PTCL introduces: (1) a temporal decoupling architecture separating the backbone (learning time-aware representations) and decoder (strictly aligned with final labels), which generate pseudo-labels, and (2) a Temporal Curriculum Learning strategy that prioritizes pseudo-labels closer to the final timestamp by assigning them higher weights using an exponentially decaying function. We contribute a new academic dataset (CoOAG), capturing long-range research interest in dynamic graph. Experiments across real-world scenarios demonstrate PTCL’s consistent superiority over other methods adapted to this task. Beyond methodology, we propose a unified framework FLiD (Framework for Label-Limited Dynamic Node Classification), consisting of a complete preparation workflow, training pipeline, and evaluation standards, and supporting various models and datasets. The code can be found at https://github.com/3205914485/FLiD.
arxiv情報
著者 | Shengtao Zhang,Haokai Zhang,Shiqi Lou,Zicheng Wang,Zinan Zeng,Yilin Wang,Minnan Luo |
発行日 | 2025-04-24 15:11:41+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google