An Aspect Extraction Framework using Different Embedding Types, Learning Models, and Dependency Structure

要約

エンティティの特定の特徴に関連するセンチメント表現に細粒の洞察を提供する能力により、アスペクトベースのセンチメント分析は近年大きな注目を集めています。
アスペクトベースのセンチメント分析の重要な要素は、テキストからアスペクト用語を識別および抽出することを含むアスペクト抽出です。
効果的なアスペクト抽出は、アスペクトレベルでの正確な感情分析の基礎として機能します。
このホワイトペーパーでは、単語やスピーチタグにさまざまな種類の埋め込みを使用し、いくつかの学習モデルを組み合わせたアスペクト抽出モデルを提案します。
また、文のアスペクト位置をより適切にキャプチャするために、依存関係解析出力に基づいたツリーの位置エンコーディングを提案します。
さらに、新しいアスペクト抽出データセットは、制御された設定で英語データセットを翻訳する機械ごとに構築されています。
2つのトルコのデータセットで実施された実験は、提案されたモデルが同じデータセットを使用する研究をほぼ上回ることを示し、ツリー位置エンコーディングを組み込むとモデルのパフォーマンスが向上することが示されました。

要約(オリジナル)

Aspect-based sentiment analysis has gained significant attention in recent years due to its ability to provide fine-grained insights for sentiment expressions related to specific features of entities. An important component of aspect-based sentiment analysis is aspect extraction, which involves identifying and extracting aspect terms from text. Effective aspect extraction serves as the foundation for accurate sentiment analysis at the aspect level. In this paper, we propose aspect extraction models that use different types of embeddings for words and part-of-speech tags and that combine several learning models. We also propose tree positional encoding that is based on dependency parsing output to capture better the aspect positions in sentences. In addition, a new aspect extraction dataset is built for Turkish by machine translating an English dataset in a controlled setting. The experiments conducted on two Turkish datasets showed that the proposed models mostly outperform the studies that use the same datasets, and incorporating tree positional encoding increases the performance of the models.

arxiv情報

著者 Ali Erkan,Tunga Güngör
発行日 2025-03-05 13:57:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク