Enhancing Keyphrase Generation by BART Finetuning with Splitting and Shuffling


シーケンスツーシーケンス モデルを利用した最近のアプローチは、不在のキーフレーズ生成に有効であることを示しています。
この論文では、キーフレーズに焦点を当てた BART を提案します。これは、存在するキーフレーズ生成と存在しないキーフレーズ生成の違いを利用し、存在するキーフレーズと存在しないキーフレーズに対して 2 つの別個の BART モデルの微調整を実行します。
キーフレーズが存在しない場合、キーフレーズに焦点を当てた BART は、5 つのキーフレーズ生成ベンチマーク データセットのうち 2 つで F1@5 で新しい最先端のスコアを達成しました。


Keyphrase generation is a task of identifying a set of phrases that best repre-sent the main topics or themes of a given text. Keyphrases are dividend int pre-sent and absent keyphrases. Recent approaches utilizing sequence-to-sequence models show effectiveness on absent keyphrase generation. However, the per-formance is still limited due to the hardness of finding absent keyphrases. In this paper, we propose Keyphrase-Focused BART, which exploits the differ-ences between present and absent keyphrase generations, and performs fine-tuning of two separate BART models for present and absent keyphrases. We further show effective approaches of shuffling keyphrases and candidate keyphrase ranking. For absent keyphrases, our Keyphrase-Focused BART achieved new state-of-the-art score on F1@5 in two out of five keyphrase gen-eration benchmark datasets.


著者 Bin Chen,Mizuho Iwaihara
発行日 2023-09-13 05:02:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.NE パーマリンク