Enhancing Multilingual Sentiment Analysis with Explainability for Sinhala, English, and Code-Mixed Content

要約

センチメント分析は、顧客のフィードバックが英語、シンハラ、シングリッシュ、コードミックステキストに及ぶ銀行セクターのブランド評判管理にとって重要です。
既存のモデルは、シンハラのような低リソース言語と格闘しており、実用的な解釈可能性がありません。
この研究は、説明可能な出力で多言語機能を強化するハイブリッドアスペクトベースのセンチメント分析フレームワークを開発します。
クリーン化された銀行のカスタマーレビューを使用して、XLM-Robertaをシンハラとコードミックステキスト用に微調整し、ドメイン固有のレキシコン補正を統合し、英語用のBert-Base-Uncasedを使用します。
システムはセンチメント(ポジティブ、ニュートラル、ネガティブ)を信頼スコアで分類しますが、SHAPとLIMEはリアルタイムセンチメントの説明を提供することで解釈性を向上させます。
実験結果は、私たちのアプローチが従来の変圧器ベースの分類器よりも優れており、92.3%の精度と英語で0.89、シンハラとコードミックスコンテンツで88.4%のF1スコアを達成することを示しています。
説明可能性分析により、主要な感情ドライバーが明らかになり、信頼と透明性が向上します。
ユーザーフレンドリーなインターフェイスは、アスペクトのセンチメントの洞察を提供し、企業のアクセシビリティを確保します。
この研究は、多言語の低リソースNLPおよび説明可能性のギャップを埋めることにより、金融アプリケーションの堅牢で透明な感情分析に貢献します。

要約(オリジナル)

Sentiment analysis is crucial for brand reputation management in the banking sector, where customer feedback spans English, Sinhala, Singlish, and code-mixed text. Existing models struggle with low-resource languages like Sinhala and lack interpretability for practical use. This research develops a hybrid aspect-based sentiment analysis framework that enhances multilingual capabilities with explainable outputs. Using cleaned banking customer reviews, we fine-tune XLM-RoBERTa for Sinhala and code-mixed text, integrate domain-specific lexicon correction, and employ BERT-base-uncased for English. The system classifies sentiment (positive, neutral, negative) with confidence scores, while SHAP and LIME improve interpretability by providing real-time sentiment explanations. Experimental results show that our approaches outperform traditional transformer-based classifiers, achieving 92.3 percent accuracy and an F1-score of 0.89 in English and 88.4 percent in Sinhala and code-mixed content. An explainability analysis reveals key sentiment drivers, improving trust and transparency. A user-friendly interface delivers aspect-wise sentiment insights, ensuring accessibility for businesses. This research contributes to robust, transparent sentiment analysis for financial applications by bridging gaps in multilingual, low-resource NLP and explainability.

arxiv情報

著者 Azmarah Rizvi,Navojith Thamindu,A. M. N. H. Adhikari,W. P. U. Senevirathna,Dharshana Kasthurirathna,Lakmini Abeywardhana
発行日 2025-04-18 08:21:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク