要約
ゼロショットイベント検出(ED)、トレーニングデータなしで自然言語テキストでイベントの言及を特定するタスクは、専門ドメインでのドキュメントの理解に重要です。
複雑なイベントオントロジーを理解し、パッセージからドメイン固有のトリガーを抽出し、それらを適切に過負荷にして構造化し、ゼロショットedの大規模な言語モデル(LLM)の有用性を制限します。
この目的のために、DreamerとGranderを使用してEDのタスクを切り離す多様な推論的推論フレームワークであるDicoreを提案します。
Dreamerは、オープンエンドのイベントの発見を通じて、イベントのカバレッジを後押しするのに役立つ異なる推論を奨励しています。
逆に、Granderは収束的な推論を導入して、フリーフォームの予測を有限状態のマシンガイド制約デコードを使用してタスク固有の命令に合わせます。
さらに、LLM-Judgeは最終出力を検証して高精度を確保します。
5つのドメインと9つのLLMにわたる6つのデータセットでの広範な実験を通じて、Dicoreが以前のゼロショット、転送学習、および推論ベースラインを一貫して上回り、最高のベースラインで4〜7%の平均F1を達成し、Dicoreを強力なゼロショットエドフレームワークとして確立する方法を示します。
要約(オリジナル)
Zero-shot Event Detection (ED), the task of identifying event mentions in natural language text without any training data, is critical for document understanding in specialized domains. Understanding the complex event ontology, extracting domain-specific triggers from the passage, and structuring them appropriately overloads and limits the utility of Large Language Models (LLMs) for zero-shot ED. To this end, we propose DiCoRe, a divergent-convergent reasoning framework that decouples the task of ED using Dreamer and Grounder. Dreamer encourages divergent reasoning through open-ended event discovery, which helps to boost event coverage. Conversely, Grounder introduces convergent reasoning to align the free-form predictions with the task-specific instructions using finite-state machine guided constrained decoding. Additionally, an LLM-Judge verifies the final outputs to ensure high precision. Through extensive experiments on six datasets across five domains and nine LLMs, we demonstrate how DiCoRe consistently outperforms prior zero-shot, transfer-learning, and reasoning baselines, achieving 4-7% average F1 gains over the best baseline — establishing DiCoRe as a strong zero-shot ED framework.
arxiv情報
| 著者 | Tanmay Parekh,Kartik Mehta,Ninareh Mehrabi,Kai-Wei Chang,Nanyun Peng |
| 発行日 | 2025-06-05 15:16:14+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google