Vietnamese multi-document summary using subgraph selection approach — VLSP 2022 AbMuSu Shared Task

要約

文書の要約は、文書の流暢で凝縮された要約を生成し、重要な情報を保持するタスクです。
ドキュメントのクラスターはマルチドキュメント要約 (MDS) の入力として機能し、クラスターの要約は出力として機能します。
この論文では、抽出 MDS 問題をサブグラフ選択に変換することに焦点を当てます。
グラフの形式で問題にアプローチすると、全体的なグラフ構造と選択されたサブグラフを利用して、同じ文書内の文間の関係と同じクラスター内の文間の関係を同時に捉えることができます。
実験は、VLSP 評価キャンペーン 2022 で公開されたベトナムのデータセットに実装されました。このモデルでは現在、公開テスト セットの ROUGH-2 $F\_1$ 測定で報告された参加チームの上位 10 チームが結果として得られます。

要約(オリジナル)

Document summarization is a task to generate afluent, condensed summary for a document, andkeep important information. A cluster of documents serves as the input for multi-document summarizing (MDS), while the cluster summary serves as the output. In this paper, we focus on transforming the extractive MDS problem into subgraph selection. Approaching the problem in the form of graphs helps to capture simultaneously the relationship between sentences in the same document and between sentences in the same cluster based on exploiting the overall graph structure and selected subgraphs. Experiments have been implemented on the Vietnamese dataset published in VLSP Evaluation Campaign 2022. This model currently results in the top 10 participating teams reported on the ROUGH-2 $F\_1$ measure on the public test set.

arxiv情報

著者 Huu-Thin Nguyen,Tam Doan Thanh,Cam-Van Thi Nguyen
発行日 2023-06-26 16:34:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク