この研究では、国家運輸安全委員会 (NTSB) のデータセットを使用します。
潜在ディリクレ割り当て (LDA)、非負行列分解 (NMF)、潜在意味分析 (LSA)、確率的潜在意味分析 (pLSA)、K 平均法クラスタリングなどの高度な自然言語処理 (NLP) 技術を適用します。
主な目的は、潜在的なテーマの特定、意味的関係の探索、確率的な関係の評価、および共通の特性に基づくクラスター インシデントです。
この研究は、事故の物語についての洞察を提供し、複雑なデータセットから貴重な情報を抽出する際の NLP およびトピック モデリング技術の多用途性を実証することにより、航空の安全に貢献します。
比較分析により、LDA がコヒーレンス値 0.597、pLSA 0.583、LSA 0.542、NMF 0.437 で最も優れたパフォーマンスを示したことがわかります。
K 平均法クラスタリングにより、インシデントの物語の共通点と独自の洞察がさらに明らかになります。
Aviation safety is a global concern, requiring detailed investigations into incidents to understand contributing factors comprehensively. This study uses the National Transportation Safety Board (NTSB) dataset. It applies advanced natural language processing (NLP) techniques, including Latent Dirichlet Allocation (LDA), Non-Negative Matrix Factorization (NMF), Latent Semantic Analysis (LSA), Probabilistic Latent Semantic Analysis (pLSA), and K-means clustering. The main objectives are identifying latent themes, exploring semantic relationships, assessing probabilistic connections, and cluster incidents based on shared characteristics. This research contributes to aviation safety by providing insights into incident narratives and demonstrating the versatility of NLP and topic modelling techniques in extracting valuable information from complex datasets. The results, including topics identified from various techniques, provide an understanding of recurring themes. Comparative analysis reveals that LDA performed best with a coherence value of 0.597, pLSA of 0.583, LSA of 0.542, and NMF of 0.437. K-means clustering further reveals commonalities and unique insights into incident narratives. In conclusion, this study uncovers latent patterns and thematic structures within incident narratives, offering a comparative analysis of multiple-topic modelling techniques. Future research avenues include exploring temporal patterns, incorporating additional datasets, and developing predictive models for early identification of safety issues. This research lays the groundwork for enhancing the understanding and improvement of aviation safety by utilising the wealth of information embedded in incident narratives.
著者 | Aziida Nanyonga,Hassan Wasswa,Ugur Turhan,Keith Joiner,Graham Wild |
発行日 | 2025-01-14 08:23:15+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google