Towards Safer Operations: An Expert-involved Dataset of High-Pressure Gas Incidents for Preventing Future Failures

要約

このペーパーでは、安全防止のための新しい IncidentAI データセットを紹介します。
通常単一のタスクを含む以前のコーパスとは異なり、私たちのデータセットは、固有表現の認識、因果関係の抽出、および情報の検索という 3 つのタスクで構成されています。
このデータセットには、高圧ガス保全管理者として少なくとも 6 年の実務経験を持つ分野の専門家によって注釈が付けられています。
安全防止のシナリオにおけるデータセットの貢献を検証します。
3 つのタスクに関する暫定的な結果は、NLP テクニックが将来の失敗を防ぐためにインシデント レポートを分析するのに有益であることを示しています。
このデータセットは、NLP およびインシデント管理コミュニティにおける将来の研究を促進します。
データセットへのアクセスも提供されます (IncidentAI データセットは https://github.com/Cinnamon/incident-ai-dataset で入手できます)。

要約(オリジナル)

This paper introduces a new IncidentAI dataset for safety prevention. Different from prior corpora that usually contain a single task, our dataset comprises three tasks: named entity recognition, cause-effect extraction, and information retrieval. The dataset is annotated by domain experts who have at least six years of practical experience as high-pressure gas conservation managers. We validate the contribution of the dataset in the scenario of safety prevention. Preliminary results on the three tasks show that NLP techniques are beneficial for analyzing incident reports to prevent future failures. The dataset facilitates future research in NLP and incident management communities. The access to the dataset is also provided (the IncidentAI dataset is available at: https://github.com/Cinnamon/incident-ai-dataset).

arxiv情報

著者 Shumpei Inoue,Minh-Tien Nguyen,Hiroki Mizokuchi,Tuan-Anh D. Nguyen,Huu-Hiep Nguyen,Dung Tien Le
発行日 2023-10-18 16:07:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク