CineXDrama: Relevance Detection and Sentiment Analysis of Bangla YouTube Comments on Movie-Drama using Transformers: Insights from Interpretability Tool

要約

近年、YouTube はバングラ語の映画やドラマの主要なプラットフォームとなっており、視聴者はコンテンツについての感情を伝えるコメントで意見を表明します。
ただし、すべてのコメントが感情分析に関連しているわけではないため、フィルタリング メカニズムが必要です。
私たちは、最初にコメントの関連性を評価し、次に関連性があると思われるコメントの感情を分析するシステムを提案します。
関連性 (関連性または無関係) およびセンチメント (肯定的または否定的) の注釈が付けられた、手動で収集および前処理された 14,000 件のコメントのデータセットを紹介します。
BanglaBERT を含む 8 つのトランスフォーマー モデルが分類タスクに使用され、BanglaBERT が最高の精度 (関連性検出で 83.99%、センチメント分析で 93.3%) を達成しました。
この研究では、LIME を統合してモデルの決定を解釈し、透明性を高めています。

要約(オリジナル)

In recent years, YouTube has become the leading platform for Bangla movies and dramas, where viewers express their opinions in comments that convey their sentiments about the content. However, not all comments are relevant for sentiment analysis, necessitating a filtering mechanism. We propose a system that first assesses the relevance of comments and then analyzes the sentiment of those deemed relevant. We introduce a dataset of 14,000 manually collected and preprocessed comments, annotated for relevance (relevant or irrelevant) and sentiment (positive or negative). Eight transformer models, including BanglaBERT, were used for classification tasks, with BanglaBERT achieving the highest accuracy (83.99% for relevance detection and 93.3% for sentiment analysis). The study also integrates LIME to interpret model decisions, enhancing transparency.

arxiv情報

著者 Usafa Akther Rifa,Pronay Debnath,Busra Kamal Rafa,Shamaun Safa Hridi,Md. Aminur Rahman
発行日 2024-12-01 21:35:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク