要約
文書の要約の問題に対する現在のニューラルネットワークベースの方法は、大きな入力を含むデータセットに適用した場合の闘争闘争です。
この論文では、宿泊施設のユーザーレビューのエンドツーエンドの要約を扱う際に、コンテンツ選択の課題に対する新しいアプローチを提案します。
抽出アプローチと外部的に事前に訓練された文レベルの埋め込みを抽象的な要約モデルに加えて組み合わせることにより、大規模な入力データセットを要約するタスクに適用される場合、既存の方法を上回ることができることを示します。
また、概要の文レベルの埋め込みを予測すると、文の選択の確率分布を一般的に予測する場合と比較するのと比較して、ゆるく整列したソースのエンドツーエンドシステムの品質が向上することを証明します。
要約(オリジナル)
Current neural network-based methods to the problem of document summarisation struggle when applied to datasets containing large inputs. In this paper we propose a new approach to the challenge of content-selection when dealing with end-to-end summarisation of user reviews of accommodations. We show that by combining an extractive approach with externally pre-trained sentence level embeddings in an addition to an abstractive summarisation model we can outperform existing methods when this is applied to the task of summarising a large input dataset. We also prove that predicting sentence level embedding of a summary increases the quality of an end-to-end system for loosely aligned source to target corpora, than compared to commonly predicting probability distributions of sentence selection.
arxiv情報
著者 | Maciej Zembrzuski,Saad Mahamood |
発行日 | 2025-05-06 12:34:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google