Enhancing Keyphrase Generation by BART Finetuning with Splitting and Shuffling

要約

キーフレーズの生成は、特定のテキストの主要なトピックやテーマを最もよく表す一連のフレーズを特定するタスクです。
キーフレーズは、存在するキーフレーズと存在しないキーフレーズの配当です。
シーケンスツーシーケンス モデルを利用した最近のアプローチは、不在のキーフレーズ生成に有効であることを示しています。
ただし、欠落しているキーフレーズを見つけるのが難しいため、パフォーマンスは依然として制限されています。
この論文では、キーフレーズに焦点を当てた BART を提案します。これは、存在するキーフレーズ生成と存在しないキーフレーズ生成の違いを利用し、存在するキーフレーズと存在しないキーフレーズに対して 2 つの別個の BART モデルの微調整を実行します。
さらに、キーフレーズのシャッフルと候補キーフレーズのランキングの効果的なアプローチを示します。
キーフレーズが存在しない場合、キーフレーズに焦点を当てた BART は、5 つのキーフレーズ生成ベンチマーク データセットのうち 2 つで F1@5 で新しい最先端のスコアを達成しました。

要約(オリジナル)

Keyphrase generation is a task of identifying a set of phrases that best repre-sent the main topics or themes of a given text. Keyphrases are dividend int pre-sent and absent keyphrases. Recent approaches utilizing sequence-to-sequence models show effectiveness on absent keyphrase generation. However, the per-formance is still limited due to the hardness of finding absent keyphrases. In this paper, we propose Keyphrase-Focused BART, which exploits the differ-ences between present and absent keyphrase generations, and performs fine-tuning of two separate BART models for present and absent keyphrases. We further show effective approaches of shuffling keyphrases and candidate keyphrase ranking. For absent keyphrases, our Keyphrase-Focused BART achieved new state-of-the-art score on F1@5 in two out of five keyphrase gen-eration benchmark datasets.

arxiv情報

著者 Bin Chen,Mizuho Iwaihara
発行日 2023-09-13 05:02:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.NE パーマリンク