Toward the Automated Construction of Probabilistic Knowledge Graphs for the Maritime Domain

要約

タイトル:海上ドメインのための確率的知識グラフの自動構築に向けて

要約:
– 国際的な海上犯罪はますます高度化しており、広範な犯罪ネットワークに関連することが多い。
– 物理的移動に関連するデータ(つまり物理センサーによって生成されたデータまたはハードデータ)だけを統合して海上の脅威を検出することは不十分であると考えられている。
– このため、ソフトデータ(特に人が生成したデータ)とハードデータを組み合わせるための研究開発の努力が行われている。
– 既存の研究では、入力ソフトデータが構造化形式で利用可能であると仮定するか、あるいは関連するエンティティやコンセプトを抽出することに重点を置いている。
– しかし、構造化されていない形式で存在する大量のソフトデータ(情報報告やニュース記事など)には、関心のある状況に間接的に組み込まれた豊富な知識を抽出することができる。
– このような情報から潜在的に有用で豊富な情報を抽出するためには、関連するエンティティやコンセプトだけでなく、抽出された知識に関連する不確実性(確率的知識グラフの形式で)も抽出する必要がある。
– この取り組みにより、抽出された知識の精度と信頼性が向上し、その後の推論や学習が容易になる。
– このため、我々はMaritime DeepDiveを提案し、海上ドメインの自然言語データから確率的知識グラフを自動構築する初期のプロトタイプを開発した。
– この論文では、Maritime DeepDiveの現在の実装と、海賊事件から確率的イベントを抽出する際の予備的な結果について報告する。
– このパイプラインは手動で作成されたゴールドスタンダードで評価され、有望な結果が得られた。

要約(オリジナル)

International maritime crime is becoming increasingly sophisticated, often associated with wider criminal networks. Detecting maritime threats by means of fusing data purely related to physical movement (i.e., those generated by physical sensors, or hard data) is not sufficient. This has led to research and development efforts aimed at combining hard data with other types of data (especially human-generated or soft data). Existing work often assumes that input soft data is available in a structured format, or is focused on extracting certain relevant entities or concepts to accompany or annotate hard data. Much less attention has been given to extracting the rich knowledge about the situations of interest implicitly embedded in the large amount of soft data existing in unstructured formats (such as intelligence reports and news articles). In order to exploit the potentially useful and rich information from such sources, it is necessary to extract not only the relevant entities and concepts but also their semantic relations, together with the uncertainty associated with the extracted knowledge (i.e., in the form of probabilistic knowledge graphs). This will increase the accuracy of and confidence in, the extracted knowledge and facilitate subsequent reasoning and learning. To this end, we propose Maritime DeepDive, an initial prototype for the automated construction of probabilistic knowledge graphs from natural language data for the maritime domain. In this paper, we report on the current implementation of Maritime DeepDive, together with preliminary results on extracting probabilistic events from maritime piracy incidents. This pipeline was evaluated on a manually crafted gold standard, yielding promising results.

arxiv情報

著者 Fatemeh Shiri,Teresa Wang,Shirui Pan,Xiaojun Chang,Yuan-Fang Li,Reza Haffari,Van Nguyen,Shuang Yu
発行日 2023-05-04 00:24:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CL パーマリンク