Vietnamese multi-document summary using subgraph selection approach — VLSP 2022 AbMuSu Shared Task


ドキュメントのクラスターはマルチドキュメント要約 (MDS) の入力として機能し、クラスターの要約は出力として機能します。
この論文では、抽出 MDS 問題をサブグラフ選択に変換することに焦点を当てます。
実験は、VLSP 評価キャンペーン 2022 で公開されたベトナムのデータセットに実装されました。このモデルでは現在、公開テスト セットの ROUGH-2 $F\_1$ 測定で報告された参加チームの上位 10 チームが結果として得られます。


Document summarization is a task to generate afluent, condensed summary for a document, andkeep important information. A cluster of documents serves as the input for multi-document summarizing (MDS), while the cluster summary serves as the output. In this paper, we focus on transforming the extractive MDS problem into subgraph selection. Approaching the problem in the form of graphs helps to capture simultaneously the relationship between sentences in the same document and between sentences in the same cluster based on exploiting the overall graph structure and selected subgraphs. Experiments have been implemented on the Vietnamese dataset published in VLSP Evaluation Campaign 2022. This model currently results in the top 10 participating teams reported on the ROUGH-2 $F\_1$ measure on the public test set.


著者 Huu-Thin Nguyen,Tam Doan Thanh,Cam-Van Thi Nguyen
発行日 2023-06-26 16:34:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CL パーマリンク