From Predictive Importance to Causality: Which Machine Learning Model Reflects Reality?

要約

この研究では、CatBoost モデルと LightGBM モデルを使用してエイムズの住宅データセットを分析し、住宅価格予測における機能の重要性と因果関係を調査します。
SHAP値とEconML予測の相関関係を調べ、高精度な価格予測を実現します。
私たちの分析では、SHAP ベースの特徴の重要性と因果的に重要な特徴の間に 0.48 という中程度のスピアマン ランク相関があることが明らかになり、住宅市場分析における予測モデリングと因果関係の理解を調整することの複雑さを浮き彫りにしています。
異質性の調査やポリシーツリーの解釈を含む広範な因果分析を通じて、ポーチなどの特定の機能がさまざまなシナリオで住宅価格にどのような影響を与えるかについての洞察を提供します。
この研究は、不動産評価における予測力と因果関係の洞察を組み合わせた統合アプローチの必要性を強調し、業界の関係者に貴重な指針を提供します。

要約(オリジナル)

This study analyzes the Ames Housing Dataset using CatBoost and LightGBM models to explore feature importance and causal relationships in housing price prediction. We examine the correlation between SHAP values and EconML predictions, achieving high accuracy in price forecasting. Our analysis reveals a moderate Spearman rank correlation of 0.48 between SHAP-based feature importance and causally significant features, highlighting the complexity of aligning predictive modeling with causal understanding in housing market analysis. Through extensive causal analysis, including heterogeneity exploration and policy tree interpretation, we provide insights into how specific features like porches impact housing prices across various scenarios. This work underscores the need for integrated approaches that combine predictive power with causal insights in real estate valuation, offering valuable guidance for stakeholders in the industry.

arxiv情報

著者 Muhammad Arbab Arshad,Pallavi Kandanur,Saurabh Sonawani,Laiba Batool,Muhammad Umar Habib
発行日 2024-09-24 17:06:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク