要約
キー ポイント分析 (KPA) は、テキスト コメントのコレクションから詳細な洞察を導き出すために最近提案されました。
KPA は、データ内の主要なポイントを、キー ポイントと呼ばれる簡潔な文またはフレーズのリストとして抽出し、その普及率を定量化します。
キー ポイントはワード クラウドやキー フレーズよりも表現力が豊かですが、キー ポイントの長くフラットなリストを理解することは、多くの場合、関連するアイデアをさまざまな粒度レベルで表現するため、依然として難しい場合があります。
KPA のこの制限に対処するために、特定のキー ポイントのセットをその特異性に応じて階層に編成するタスクを導入します。
このような階層は、新しいタイプのテキスト含意グラフと見なすことができます。
私たちは、複数のアノテーションを統合することで得られる、ビジネスおよび製品レビューのキーポイント階層の高品質ベンチマーク データセットである ThinkP を開発しています。
キーポイント間のペアごとの関係を予測し、これらのペアごとの予測から階層を推測するさまざまな方法を比較します。
特に、ペアワイズキーポイント関係を計算するタスクでは、方向分布類似性手法をキーポイントの新しい分布表現に適用することで、既存の強力なベースラインを超える大幅な改善を達成し、弱い監視によってパフォーマンスをさらに向上させます。
要約(オリジナル)
Key Point Analysis (KPA) has been recently proposed for deriving fine-grained insights from collections of textual comments. KPA extracts the main points in the data as a list of concise sentences or phrases, termed key points, and quantifies their prevalence. While key points are more expressive than word clouds and key phrases, making sense of a long, flat list of key points, which often express related ideas in varying levels of granularity, may still be challenging. To address this limitation of KPA, we introduce the task of organizing a given set of key points into a hierarchy, according to their specificity. Such hierarchies may be viewed as a novel type of Textual Entailment Graph. We develop ThinkP, a high quality benchmark dataset of key point hierarchies for business and product reviews, obtained by consolidating multiple annotations. We compare different methods for predicting pairwise relations between key points, and for inferring a hierarchy from these pairwise predictions. In particular, for the task of computing pairwise key point relations, we achieve significant gains over existing strong baselines by applying directional distributional similarity methods to a novel distributional representation of key points, and further boost performance via weak supervision.
arxiv情報
著者 | Arie Cattan,Lilach Eden,Yoav Kantor,Roy Bar-Haim |
発行日 | 2023-06-06 16:45:44+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google