要約
意見要約とは、ユーザーレビューから一般的な意見を抽出して要約を作成するタスクです。
この論文では、教師なし抽出意見要約を実行する新しいシステムである Geodesic Summarizer (GeoSumm) を紹介します。
GeoSumm には、潜在的なセマンティック ユニットの分布としてテキストの表現を生成する、エンコーダー/デコーダー ベースの表現学習モデルが含まれます。
GeoSumm は、複数のデコーダ層で事前トレーニング済みのテキスト表現に対して辞書学習を実行することにより、これらの表現を生成します。
次に、これらの表現を使用して、新しいおおよその測地線距離ベースのスコアリング メカニズムを使用して、レビュー文の関連性を定量化します。
関連性スコアを使用して一般的な意見を特定し、一般的および側面固有の要約を作成します。
私たちが提案するモデル GeoSumm は、3 つの意見要約データセットで最先端のパフォーマンスを実現します。
モデルの機能を分析し、さまざまなドメインにわたる {\X} の一般化能力を示すために、追加の実験を行います。
要約(オリジナル)
Opinion summarization is the task of creating summaries capturing popular opinions from user reviews. In this paper, we introduce Geodesic Summarizer (GeoSumm), a novel system to perform unsupervised extractive opinion summarization. GeoSumm involves an encoder-decoder based representation learning model, that generates representations of text as a distribution over latent semantic units. GeoSumm generates these representations by performing dictionary learning over pre-trained text representations at multiple decoder layers. We then use these representations to quantify the relevance of review sentences using a novel approximate geodesic distance based scoring mechanism. We use the relevance scores to identify popular opinions in order to compose general and aspect-specific summaries. Our proposed model, GeoSumm, achieves state-of-the-art performance on three opinion summarization datasets. We perform additional experiments to analyze the functioning of our model and showcase the generalization ability of {\X} across different domains.
arxiv情報
著者 | Somnath Basu Roy Chowdhury,Nicholas Monath,Avinava Dubey,Amr Ahmed,Snigdha Chaturvedi |
発行日 | 2023-03-15 17:08:31+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google