Shall We Trust All Relational Tuples by Open Information Extraction? A Study on Speculation Detection

要約

タイトル「オープン情報抽出によるすべての関係タプルを信頼すべきか?仮説検出に関する研究」
要約
– OIEとは、オープンドメインの文から事実的な関係タプルを抽出することを目的とした技術である
– Downstream tasksでは、抽出されたOIEタプルを事実とみなして使われるが、不確実性/仮説は一般的な言語現象である
– 既存の研究は文レベルでの仮説検出に限定されているため、文が仮説的であっても、その文から抽出されたすべてのタプルが仮説的であるわけではない
– 本論文では、OIEにおける仮説について研究し、抽出されたタプルが仮説的であるかどうかを決定することを目的とする
– タプルレベルの仮説検出の研究問題を形式的に定義し、仮説的なタプルに対するラベルを持つLSOIEデータセットで詳細なデータ分析を実施する
– 最後に、この新しい研究タスクのためのベースラインモデルであるOIE-Specを提案する

要約(オリジナル)

Open Information Extraction (OIE) aims to extract factual relational tuples from open-domain sentences. Downstream tasks use the extracted OIE tuples as facts, without examining the certainty of these facts. However, uncertainty/speculation is a common linguistic phenomenon. Existing studies on speculation detection are defined at sentence level, but even if a sentence is determined to be speculative, not all tuples extracted from it may be speculative. In this paper, we propose to study speculations in OIE and aim to determine whether an extracted tuple is speculative. We formally define the research problem of tuple-level speculation detection and conduct a detailed data analysis on the LSOIE dataset which contains labels for speculative tuples. Lastly, we propose a baseline model OIE-Spec for this new research task.

arxiv情報

著者 Kuicai Dong,Aixin Sun,Jung-Jae Kim,Xiaoli Li
発行日 2023-05-07 03:47:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CL パーマリンク