要約
離散選択モデル(DCM)は、輸送の選択、政治選挙、消費者の好みなどのコンテキストでの個々の意思決定を分析するために使用されます。
DCMは、新しい非標識データの選択の予測だけに焦点を当てるのではなく、代替の限界速度など、主要な経済変数に推論を可能にすることにより、応用計量経済学において中心的な役割を果たします。
ただし、従来のDCMは、経済量のポイントとインターバル推定の高い解釈性とサポートを提供しますが、これらのモデルは、ディープラーニング(DL)モデルと比較して予測タスクでパフォーマンスが低下していることがよくあります。
予測上の利点にもかかわらず、DLモデルは、解釈可能性の欠如、不安定なパラメーターの推定値、不確実性の定量化のための確立された方法がないことに関する懸念により、個別の選択ではほとんど十分に活用されていません。
ここでは、確率的勾配ランジュビンダイナミクス(SGLD)などのおおよそのベイジアン推論方法と統合するように特別に設計された深い学習モデルアーキテクチャを紹介します。
私たちの提案されたモデルは、データが制限されているときに行動的に情報に基づいた仮説に崩壊し、十分なデータが利用可能な場合に複雑な非線形関係をキャプチャする柔軟性を保持しながら、概念のない設定の過剰適合と不安定性を軽減します。
モンテカルロシミュレーション研究を通じてSGLDを使用してアプローチを実証し、代替インターバル推定値の限界率の経験的カバレッジなど、サンプル外のバランスの正確性と推論的メトリックなどの予測メトリックの両方を評価します。
さらに、2つの実証的なケーススタディの結果を示します。1つはNYCで明らかにされたモード選択データを使用し、もう1つは広く使用されているスイスの列車の選択肢に基づいていることを示しています。
要約(オリジナル)
Discrete choice models (DCMs) are used to analyze individual decision-making in contexts such as transportation choices, political elections, and consumer preferences. DCMs play a central role in applied econometrics by enabling inference on key economic variables, such as marginal rates of substitution, rather than focusing solely on predicting choices on new unlabeled data. However, while traditional DCMs offer high interpretability and support for point and interval estimation of economic quantities, these models often underperform in predictive tasks compared to deep learning (DL) models. Despite their predictive advantages, DL models remain largely underutilized in discrete choice due to concerns about their lack of interpretability, unstable parameter estimates, and the absence of established methods for uncertainty quantification. Here, we introduce a deep learning model architecture specifically designed to integrate with approximate Bayesian inference methods, such as Stochastic Gradient Langevin Dynamics (SGLD). Our proposed model collapses to behaviorally informed hypotheses when data is limited, mitigating overfitting and instability in underspecified settings while retaining the flexibility to capture complex nonlinear relationships when sufficient data is available. We demonstrate our approach using SGLD through a Monte Carlo simulation study, evaluating both predictive metrics–such as out-of-sample balanced accuracy–and inferential metrics–such as empirical coverage for marginal rates of substitution interval estimates. Additionally, we present results from two empirical case studies: one using revealed mode choice data in NYC, and the other based on the widely used Swiss train choice stated preference data.
arxiv情報
著者 | Daniel F. Villarraga,Ricardo A. Daziano |
発行日 | 2025-05-23 16:33:47+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google