Interpretable Bangla Sarcasm Detection using BERT and Explainable AI

要約

肯定的なフレーズや根底にある否定的な動機を持つ文は、通常、Facebook、Twitter、Reddit などの今日のソーシャル メディア プラットフォームで広く使用されている皮肉と定義されます。最近では、ソーシャル メディア プラットフォームのアクティブ ユーザーが劇的に増加しており、
市場の需要の判断、センチメント分析、脅威の検出など、さまざまなタスクで利用できる自動化された NLP ベースのシステムの必要性
NLP ベースのモデルを使用すると、より複雑になります。
その結果、過去数年間、英語での皮肉の検出に関する多くの研究が行われ、顕著な改善が見られましたが、バングラ語の状態での皮肉の検出は同じままです。
この記事では、利用されている従来の機械学習アルゴリズムが 89.93\% しか達成できないのに対し、99.60\% を達成できる BERT ベースのシステムを紹介します。
さらに、システムに説明可能性を導入する、ローカルで解釈可能なモデルに依存しない説明を採用しました。
さらに、この研究の評価のために特別に構築された、新しく収集されたバングラ皮肉データセットである BanglaSarc を利用しました。
このデータセットは、皮肉なコメントと皮肉でないコメントの最新の記録で構成されており、その大部分は Facebook と YouTube のコメント セクションから取得されています。

要約(オリジナル)

A positive phrase or a sentence with an underlying negative motive is usually defined as sarcasm that is widely used in today’s social media platforms such as Facebook, Twitter, Reddit, etc. In recent times active users in social media platforms are increasing dramatically which raises the need for an automated NLP-based system that can be utilized in various tasks such as determining market demand, sentiment analysis, threat detection, etc. However, since sarcasm usually implies the opposite meaning and its detection is frequently a challenging issue, data meaning extraction through an NLP-based model becomes more complicated. As a result, there has been a lot of study on sarcasm detection in English over the past several years, and there’s been a noticeable improvement and yet sarcasm detection in the Bangla language’s state remains the same. In this article, we present a BERT-based system that can achieve 99.60\% while the utilized traditional machine learning algorithms are only capable of achieving 89.93\%. Additionally, we have employed Local Interpretable Model-Agnostic Explanations that introduce explainability to our system. Moreover, we have utilized a newly collected bangla sarcasm dataset, BanglaSarc that was constructed specifically for the evaluation of this study. This dataset consists of fresh records of sarcastic and non-sarcastic comments, the majority of which are acquired from Facebook and YouTube comment sections.

arxiv情報

著者 Ramisa Anan,Tasnim Sakib Apon,Zeba Tahsin Hossain,Elizabeth Antora Modhu,Sudipta Mondal,MD. Golam Rabiul Alam
発行日 2023-03-22 17:35:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク