Hierarchical Delay Attribution Classification using Unstructured Text in Train Management Systems

要約

EU 指令では、列車遅延の体系的なフォローアップを規定しています。
スウェーデンでは、スウェーデン運輸局が適切な遅延帰属コードを登録して割り当てます。
ただし、この遅延帰属コードは手動で割り当てられるため、作業が複雑になります。
この論文では、イベントの説明に基づいて遅延属性コードを割り当てるための機械学習ベースの意思決定支援を調査します。
テキストは TF-IDF を使用して変換され、ランダム フォレストとサポート ベクター マシンの 2 つのモデルがランダムな均一分類器とスウェーデン運輸局の分類パフォーマンスに対して評価されます。
さらに、この問題は階層的アプローチとフラットなアプローチの両方としてモデル化されています。
結果は、階層的アプローチの方がフラットなアプローチよりもパフォーマンスが良いことを示しています。
どちらのアプローチも、ランダム均一分類器よりはパフォーマンスが優れていますが、手動分類よりはパフォーマンスが悪くなります。

要約(オリジナル)

EU directives stipulate a systematic follow-up of train delays. In Sweden, the Swedish Transport Administration registers and assigns an appropriate delay attribution code. However, this delay attribution code is assigned manually, which is a complex task. In this paper, a machine learning-based decision support for assigning delay attribution codes based on event descriptions is investigated. The text is transformed using TF-IDF, and two models, Random Forest and Support Vector Machine, are evaluated against a random uniform classifier and the classification performance of the Swedish Transport Administration. Further, the problem is modeled as both a hierarchical and flat approach. The results indicate that a hierarchical approach performs better than a flat approach. Both approaches perform better than the random uniform classifier but perform worse than the manual classification.

arxiv情報

著者 Anton Borg,Per Lingvall,Martin Svensson
発行日 2024-02-06 16:02:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク