要約
EU 指令では、列車遅延の体系的なフォローアップを規定しています。
スウェーデンでは、スウェーデン運輸局が適切な遅延帰属コードを登録して割り当てます。
ただし、この遅延帰属コードは手動で割り当てられるため、作業が複雑になります。
この論文では、イベントの説明に基づいて遅延属性コードを割り当てるための機械学習ベースの意思決定支援を調査します。
テキストは TF-IDF を使用して変換され、ランダム フォレストとサポート ベクター マシンの 2 つのモデルがランダムな均一分類器とスウェーデン運輸局の分類パフォーマンスに対して評価されます。
さらに、この問題は階層的アプローチとフラットなアプローチの両方としてモデル化されています。
結果は、階層的アプローチの方がフラットなアプローチよりもパフォーマンスが良いことを示しています。
どちらのアプローチも、ランダム均一分類器よりはパフォーマンスが優れていますが、手動分類よりはパフォーマンスが悪くなります。
要約(オリジナル)
EU directives stipulate a systematic follow-up of train delays. In Sweden, the Swedish Transport Administration registers and assigns an appropriate delay attribution code. However, this delay attribution code is assigned manually, which is a complex task. In this paper, a machine learning-based decision support for assigning delay attribution codes based on event descriptions is investigated. The text is transformed using TF-IDF, and two models, Random Forest and Support Vector Machine, are evaluated against a random uniform classifier and the classification performance of the Swedish Transport Administration. Further, the problem is modeled as both a hierarchical and flat approach. The results indicate that a hierarchical approach performs better than a flat approach. Both approaches perform better than the random uniform classifier but perform worse than the manual classification.
arxiv情報
著者 | Anton Borg,Per Lingvall,Martin Svensson |
発行日 | 2024-02-06 16:02:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google