要約
このペーパーでは、実際の使用のために大規模な言語モデル(LLMS)を使用して、アスペクトベースのセンチメント分析システムの設計を調査します。
私たちは、四足動物の意見抽出に焦点を当てています – 異なるドメインや言語にわたるテキストデータからのアスペクトカテゴリ、センチメントの極性、ターゲット、および意見表現を特定します。
内部データセットを使用して、単一の微調整されたモデルが複数のドメイン固有の分類法を同時に効果的に処理できるかどうかを調査します。
複合マルチドメインモデルは、運用上の複雑さを減らしながら、特殊な単一ドメインモデルに匹敵するパフォーマンスを実現することを実証します。
また、構造化された予測タスク用のLLMベースのシステムを開発する際に、非抽出予測を処理し、さまざまな障害モードを評価するために学んだ教訓を共有します。
要約(オリジナル)
This paper explores the design of an aspect-based sentiment analysis system using large language models (LLMs) for real-world use. We focus on quadruple opinion extraction — identifying aspect categories, sentiment polarity, targets, and opinion expressions from text data across different domains and languages. Using internal datasets, we investigate whether a single fine-tuned model can effectively handle multiple domain-specific taxonomies simultaneously. We demonstrate that a combined multi-domain model achieves performance comparable to specialized single-domain models while reducing operational complexity. We also share lessons learned for handling non-extractive predictions and evaluating various failure modes when developing LLM-based systems for structured prediction tasks.
arxiv情報
著者 | Benjamin White,Anastasia Shimorina |
発行日 | 2025-05-15 15:11:48+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google