Interpretable Graph Neural Networks for Heterogeneous Tabular Data


表形式データの機械学習アルゴリズムの多くはブラックボックス モデルを生成するため、ユーザーはモデル予測の背後にある理論的根拠を理解できません。
制約のない形式では、グラフ ニューラル ネットワークはこのカテゴリに分類され、異種データを処理する能力はさらに制限されます。
これらの制限を克服するために、IGNH (Interpretable Graph Neural Network for Heterogeneous tableular data) と呼ばれるアプローチが提案されています。これは、予測とともに正確な特徴属性を生成するように学習プロセスを制約しながら、カテゴリ特徴と数値特徴の両方を処理します。
大規模な実証調査が提示され、IGNH によって提供される特徴属性が事後的に計算された Shapley 値と一致することが示されています。
さらに、結果は、IGNH が表形式データ用の 2 つの強力な機械学習アルゴリズムであるランダム フォレストと TabNet を上回り、XGBoost と同等のパフォーマンス レベルに達していることを示しています。


Many machine learning algorithms for tabular data produce black-box models, which prevent users from understanding the rationale behind the model predictions. In their unconstrained form, graph neural networks fall into this category, and they have further limited abilities to handle heterogeneous data. To overcome these limitations, an approach is proposed, called IGNH (Interpretable Graph Neural Network for Heterogeneous tabular data), which handles both categorical and numerical features, while constraining the learning process to generate exact feature attributions together with the predictions. A large-scale empirical investigation is presented, showing that the feature attributions provided by IGNH align with Shapley values that are computed post hoc. Furthermore, the results show that IGNH outperforms two powerful machine learning algorithms for tabular data, Random Forests and TabNet, while reaching a similar level of performance as XGBoost.


著者 Amr Alkhatib,Henrik Boström
発行日 2024-08-14 16:49:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG パーマリンク