要約
さまざまな集団から収集したデータに基づいて訓練された生成言語モデルを使用して、テキストコレクションから意見をマイニングするための新しい方法を紹介します。
意見洞察マイニングの基本的な定義、方法論、一般的なアルゴリズムについて説明します。
不自然で完全に注釈が付けられた意見を含む特別に調整されたコンテンツを使用して、事前トレーニングされた生成モデルが微調整される実験で、私たちの方法のパフォーマンスを実証します。
私たちのアプローチは、二極化の割合を維持しながら、意見を学習して意味クラスに転送できることを示します。
最後に、実際のテキスト コーパスからの意見洞察の発見をスケールアップするための洞察マイニング システムの使用法を示します。
要約(オリジナル)
We present a novel method for mining opinions from text collections using generative language models trained on data collected from different populations. We describe the basic definitions, methodology and a generic algorithm for opinion insight mining. We demonstrate the performance of our method in an experiment where a pre-trained generative model is fine-tuned using specifically tailored content with unnatural and fully annotated opinions. We show that our approach can learn and transfer the opinions to the semantic classes while maintaining the proportion of polarisation. Finally, we demonstrate the usage of an insight mining system to scale up the discovery of opinion insights from a real text corpus.
arxiv情報
著者 | Allmin Susaiyah,Abhinay Pandya,Aki Härmä |
発行日 | 2023-07-24 23:42:32+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google