BibRank: Automatic Keyphrase Extraction Platform Using~Metadata

要約

自動キーフレーズ抽出には、文書内の重要なフレーズの識別が含まれます。
これらのキーフレーズは、ドキュメントの分類、クラスタリング、推奨、インデックス付け、検索、要約、テキストの簡略化などのさまざまなタスクで重要です。
このペーパーでは、キーフレーズ データセットを統合し、キーフレーズ抽出アルゴリズムの評価を容易にするプラットフォームを紹介します。
このプラットフォームには、BibTeX 形式の書誌データを解析して得られる豊富なデータセットを活用する自動キーフレーズ抽出アルゴリズムである BibRank が含まれています。
BibRank は、革新的な重み付け技術と位置情報、統計情報、および単語の共起情報を組み合わせて、文書からキーフレーズを抽出します。
このプラットフォームは、キーフレーズ抽出アルゴリズムを強化し、自然言語処理の分野を進歩させようとしている研究者や開発者にとって価値があることが証明されています。

要約(オリジナル)

Automatic Keyphrase Extraction involves identifying essential phrases in a document. These keyphrases are crucial in various tasks such as document classification, clustering, recommendation, indexing, searching, summarization, and text simplification. This paper introduces a platform that integrates keyphrase datasets and facilitates the evaluation of keyphrase extraction algorithms. The platform includes BibRank, an automatic keyphrase extraction algorithm that leverages a rich dataset obtained by parsing bibliographic data in BibTeX format. BibRank combines innovative weighting techniques with positional, statistical, and word co-occurrence information to extract keyphrases from documents. The platform proves valuable for researchers and developers seeking to enhance their keyphrase extraction algorithms and advance the field of natural language processing.

arxiv情報

著者 Abdelrhman Eldallal,Eduard Barbu
発行日 2023-10-13 14:44:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク