要約
移動モードの選択を予測するためのさまざまな機械学習 (ML) アプローチの出現は、交通モデラーに興味深い質問を投げかけています。それは、どのモデルをどのアプリケーションに使用する必要があるのかということです。
この質問に対する答えは、単純な予測パフォーマンスを超えて、動作の解釈可能性と説明可能性、計算の複雑さ、データ効率など、多くの要素のバランスによって決まります。
さまざまな ML 分類器の予測パフォーマンスを古典的なランダム ユーティリティ モデルと比較しようとする研究が増えています。
ただし、既存の研究は通常、モデルの選択に影響を与える他の側面を無視して、非集計予測パフォーマンスのみを分析します。
さらに、多くの研究は、不適切な検証スキームの使用、階層データの不正確なサンプリング、外部検証の欠如、離散メトリクスの排他的使用などの技術的制限の影響を受けています。
私たちは、モデルの選択に影響を与える可能性が高い主要な要素 (サンプル外の予測パフォーマンス、予測市場シェアの精度、行動指標の抽出、
および計算効率)。
データ生成機能がわかっているいくつかの実世界のデータセットを合成データセットと組み合わせます。
結果は、最も高い非集合予測パフォーマンスを持つモデル (極端な勾配ブースティングとランダム フォレスト) は、ディープ ニューラル ネットワークや多項ロジットを含む他のモデルに比べて、動作指標と集合モード シェアの推定値が低く、推定コストが高いことを示しています。
(MNL)。
さらに、ML 技術により支払い意思などの行動指標の推定値を改善できるにもかかわらず、MNL モデルがさまざまな状況で堅牢に機能することが観察されています。
要約(オリジナル)
The emergence of a variety of Machine Learning (ML) approaches for travel mode choice prediction poses an interesting question to transport modellers: which models should be used for which applications? The answer to this question goes beyond simple predictive performance, and is instead a balance of many factors, including behavioural interpretability and explainability, computational complexity, and data efficiency. There is a growing body of research which attempts to compare the predictive performance of different ML classifiers with classical random utility models. However, existing studies typically analyse only the disaggregate predictive performance, ignoring other aspects affecting model choice. Furthermore, many studies are affected by technical limitations, such as the use of inappropriate validation schemes, incorrect sampling for hierarchical data, lack of external validation, and the exclusive use of discrete metrics. We address these limitations by conducting a systematic comparison of different modelling approaches, across multiple modelling problems, in terms of the key factors likely to affect model choice (out-of-sample predictive performance, accuracy of predicted market shares, extraction of behavioural indicators, and computational efficiency). We combine several real world datasets with synthetic datasets, where the data generation function is known. The results indicate that the models with the highest disaggregate predictive performance (namely extreme gradient boosting and random forests) provide poorer estimates of behavioural indicators and aggregate mode shares, and are more expensive to estimate, than other models, including deep neural networks and Multinomial Logit (MNL). It is further observed that the MNL model performs robustly in a variety of situations, though ML techniques can improve the estimates of behavioural indices such as Willingness to Pay.
arxiv情報
著者 | José Ángel Martín-Baos,Julio Alberto López-Gómez,Luis Rodriguez-Benitez,Tim Hillel,Ricardo García-Ródenas |
発行日 | 2023-09-12 14:34:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google