Unsupervised Opinion Summarization Using Approximate Geodesics

要約

意見の要約は、ユーザーのレビューから一般的な意見を収集して要約を作成するタスクです。
本稿では、教師なし抽出意見要約を実行する新しいシステムである Geodesic Summarizer (GeoSumm) を紹介します。
GeoSumm には、エンコーダ/デコーダベースの表現学習モデルが含まれており、潜在的な意味単位にわたる分布としてテキストの表現を生成します。
GeoSumm は、複数のデコーダー層で事前トレーニングされたテキスト表現に対して辞書学習を実行することにより、これらの表現を生成します。
次に、これらの表現を使用して、新しいおおよその測地距離ベースのスコアリング メカニズムを使用してレビュー文の関連性を定量化します。
一般的な概要と側面固有の概要を作成するために、関連性スコアを使用して一般的な意見を特定します。
私たちが提案するモデル GeoSumm は、3 つの意見要約データセットで最先端のパフォーマンスを実現します。
追加の実験を実行してモデルの機能を分析し、さまざまなドメインにわたる {\X} の汎化能力を示します。

要約(オリジナル)

Opinion summarization is the task of creating summaries capturing popular opinions from user reviews. In this paper, we introduce Geodesic Summarizer (GeoSumm), a novel system to perform unsupervised extractive opinion summarization. GeoSumm involves an encoder-decoder based representation learning model, that generates representations of text as a distribution over latent semantic units. GeoSumm generates these representations by performing dictionary learning over pre-trained text representations at multiple decoder layers. We then use these representations to quantify the relevance of review sentences using a novel approximate geodesic distance based scoring mechanism. We use the relevance scores to identify popular opinions in order to compose general and aspect-specific summaries. Our proposed model, GeoSumm, achieves state-of-the-art performance on three opinion summarization datasets. We perform additional experiments to analyze the functioning of our model and showcase the generalization ability of {\X} across different domains.

arxiv情報

著者 Somnath Basu Roy Chowdhury,Nicholas Monath,Avinava Dubey,Amr Ahmed,Snigdha Chaturvedi
発行日 2023-11-20 15:57:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク