Causality Extraction from Nuclear Licensee Event Reports Using a Hybrid Framework

要約

業界全体の原子力発電所の運転経験は、信頼性およびリスク モデルのパラメータ推定を実行するための生データの重要な情報源です。
多くの運用経験情報は障害イベントに関連しており、説明などの非構造化データを含むレポートとして保存されます。
イベント レポートは、関連する多数の因果関係を含め、障害がどのように発生し伝播するかを理解するために不可欠です。
ディープラーニングを使用した因果関係の抽出は、自然言語処理 (NLP) の分野における重要なフロンティアであり、膨大な量の書かれた情報に含まれる複雑な物語やつながりの解釈を可能にするため、非常に重要です。
この論文は、原子力事業者イベント報告書からの因果関係の検出と抽出のためのハイブリッドフレームワークを提案しました。
主な貢献には、(1) 因果関係分析用に 20,129 個のテキスト サンプルを含む LER コーパスを編集したこと、(2) 因果関係ペアにラベルを付けるための対話型ツールを開発したこと、(3) 因果関係検出のための深層学習ベースのアプローチを構築したこと、
(4) 知識ベースの因果関係抽出アプローチを開発しました。

要約(オリジナル)

Industry-wide nuclear power plant operating experience is a critical source of raw data for performing parameter estimations in reliability and risk models. Much operating experience information pertains to failure events and is stored as reports containing unstructured data, such as narratives. Event reports are essential for understanding how failures are initiated and propagated, including the numerous causal relations involved. Causal relation extraction using deep learning represents a significant frontier in the field of natural language processing (NLP), and is crucial since it enables the interpretation of intricate narratives and connections contained within vast amounts of written information. This paper proposed a hybrid framework for causality detection and extraction from nuclear licensee event reports. The main contributions include: (1) we compiled an LER corpus with 20,129 text samples for causality analysis, (2) developed an interactive tool for labeling cause effect pairs, (3) built a deep-learning-based approach for causal relation detection, and (4) developed a knowledge based cause-effect extraction approach.

arxiv情報

著者 Shahidur Rahoman Sohag,Sai Zhang,Min Xian,Shoukun Sun,Fei Xu,Zhegang Ma
発行日 2024-04-22 15:25:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク