Enhancing Missing Data Imputation through Combined Bipartite Graph and Complete Directed Graph

要約

このペーパーでは、欠損データ補完の分野における重要な課題、つまり、特徴間の相互依存性を特定して活用して、表形式データの欠損データ補完を強化することを目的としています。
Bipartite and Complete Directed Graph Neural Network (BCGNN) という新しいフレームワークを紹介します。
BCGNN 内では、観測値とフィーチャは 2 つの異なるノード タイプとして区別され、観測されたフィーチャの値はそれらをリンクする属性付きエッジに変換されます。
私たちのフレームワークの 2 部セグメントは、ノードの埋め込み表現を帰納的に学習し、属性付きエッジにカプセル化された包括的な情報を効率的に利用します。
並行して、完全な有向グラフ セグメントは、機能間の複雑な相互依存関係を適切に概説し、伝達します。
現在の主要な代入手法と比較した場合、BCGNN は一貫してそれらを上回っており、さまざまな欠落メカニズムの下での特徴代入タスクの平均絶対誤差で 15% という注目に値する平均減少を達成しています。
私たちの広範な実験調査により、相互依存構造を徹底的に把握することで、モデルの特徴埋め込み能力が大幅に向上することが確認されました。
また、欠損データを含むラベル予測タスクにおけるモデルの優れたパフォーマンスと、目に見えないデータ ポイントを一般化するその恐るべき能力も強調します。

要約(オリジナル)

In this paper, we aim to address a significant challenge in the field of missing data imputation: identifying and leveraging the interdependencies among features to enhance missing data imputation for tabular data. We introduce a novel framework named the Bipartite and Complete Directed Graph Neural Network (BCGNN). Within BCGNN, observations and features are differentiated as two distinct node types, and the values of observed features are converted into attributed edges linking them. The bipartite segment of our framework inductively learns embedding representations for nodes, efficiently utilizing the comprehensive information encapsulated in the attributed edges. In parallel, the complete directed graph segment adeptly outlines and communicates the complex interdependencies among features. When compared to contemporary leading imputation methodologies, BCGNN consistently outperforms them, achieving a noteworthy average reduction of 15% in mean absolute error for feature imputation tasks under different missing mechanisms. Our extensive experimental investigation confirms that an in-depth grasp of the interdependence structure substantially enhances the model’s feature embedding ability. We also highlight the model’s superior performance in label prediction tasks involving missing data, and its formidable ability to generalize to unseen data points.

arxiv情報

著者 Zhaoyang Zhang,Hongtu Zhu,Ziqi Chen,Yingjie Zhang,Hai Shu
発行日 2024-11-07 17:48:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク