要約
限られたトレーニング例では固有の情報が不足しているため、低リソースの情報抽出という課題に対処することは依然として継続的な問題です。
潜在的な解決策と考えられている既存のデータ拡張手法は、弱い拡張(例:同義語拡張)と大幅な拡張(例:適切なガイダンスのない条件付き生成)の間のバランスを取るのに苦労しています。
この論文では、ターゲットを絞った拡張と逆検証を使用して、多様性、極性、精度、一貫性が強化された拡張サンプルを生成する新しいパラダイムを紹介します。
広範な実験結果により、提案されたパラダイムの有効性が実証されています。
さらに、特定された制限についても議論し、将来の改善の余地がある領域を明らかにします。
要約(オリジナル)
Addressing the challenge of low-resource information extraction remains an ongoing issue due to the inherent information scarcity within limited training examples. Existing data augmentation methods, considered potential solutions, struggle to strike a balance between weak augmentation (e.g., synonym augmentation) and drastic augmentation (e.g., conditional generation without proper guidance). This paper introduces a novel paradigm that employs targeted augmentation and back validation to produce augmented examples with enhanced diversity, polarity, accuracy, and coherence. Extensive experimental results demonstrate the effectiveness of the proposed paradigm. Furthermore, identified limitations are discussed, shedding light on areas for future improvement.
arxiv情報
著者 | Sijia Wang,Lifu Huang |
発行日 | 2024-05-14 16:15:31+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google