YAYI-UIE: A Chat-Enhanced Instruction Tuning Framework for Universal Information Extraction

要約

情報抽出タスクの難しさは、タスク固有のラベル スキーマと異種データ構造を扱うことにあります。
最近の研究では、大規模な言語モデルに基づいて、さまざまな情報抽出タスクを均一にモデル化する方法が提案されています。
しかしながら、これらの既存の方法は、英語以外の中国語に対する情報抽出能力が不十分である。
この論文では、中国語と英語の両方をサポートする、ユニバーサル情報抽出のためのエンドツーエンドのチャット強化命令チューニング フレームワーク (YAYI-UIE) を提案します。
具体的には、対話データと情報抽出データを活用し、情報抽出性能を共同で高めます。
実験結果は、私たちが提案したフレームワークが中国語のデータセットで最先端のパフォーマンスを達成すると同時に、教師あり設定とゼロショット設定の両方で英語のデータセットでも同等のパフォーマンスを達成することを示しています。

要約(オリジナル)

The difficulty of the information extraction task lies in dealing with the task-specific label schemas and heterogeneous data structures. Recent work has proposed methods based on large language models to uniformly model different information extraction tasks. However, these existing methods are deficient in their information extraction capabilities for Chinese languages other than English. In this paper, we propose an end-to-end chat-enhanced instruction tuning framework for universal information extraction (YAYI-UIE), which supports both Chinese and English. Specifically, we utilize dialogue data and information extraction data to enhance the information extraction performance jointly. Experimental results show that our proposed framework achieves state-of-the-art performance on Chinese datasets while also achieving comparable performance on English datasets under both supervised settings and zero-shot settings.

arxiv情報

著者 Xinglin Xiao,Yijie Wang,Nan Xu,Yuqi Wang,Hanxuan Yang,Minzheng Wang,Yin Luo,Lei Wang,Wenji Mao,Daniel Zeng
発行日 2024-01-08 02:36:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク