要約
このペーパーでは、「アラビア AI タスク評価 (ArAiEval) 共有タスク 2023」に対する当社のアプローチに焦点を当てます。
それぞれ説得手法の検出と偽情報の検出に焦点を当てた、共有タスクのタスク 1-A とタスク 2-A に対するアプローチを紹介します。
本物の情報の歪曲を避けるためには、説得手法や偽情報の検出が不可欠になっています。
このタスクでは、指定された二値分類問題に対して、ツイートやニュース記事の複数のジャンルのスニペットを使用します。
アラビア語で事前トレーニングされたいくつかのトランスフォーマーベースのモデルを実験します。
提供されたデータセットに基づいてこれらの最先端のモデルを微調整します。
アンサンブルはシステムのパフォーマンスを向上させるために採用されています。
タスク 1-A では 0.742 (リーダーボードで 8 位)、タスク 2-A では 0.901 (リーダーボードで 7 位) のマイクロ F1 スコアをそれぞれ達成しました。
要約(オリジナル)
In this paper, we highlight our approach for the ‘Arabic AI Tasks Evaluation (ArAiEval) Shared Task 2023’. We present our approaches for task 1-A and task 2-A of the shared task which focus on persuasion technique detection and disinformation detection respectively. Detection of persuasion techniques and disinformation has become imperative to avoid distortion of authentic information. The tasks use multigenre snippets of tweets and news articles for the given binary classification problem. We experiment with several transformer-based models that were pre-trained on the Arabic language. We fine-tune these state-of-the-art models on the provided dataset. Ensembling is employed to enhance the performance of the systems. We achieved a micro F1-score of 0.742 on task 1-A (8th rank on the leaderboard) and 0.901 on task 2-A (7th rank on the leaderboard) respectively.
arxiv情報
著者 | Sudeep Mangalvedhekar,Kshitij Deshpande,Yash Patwardhan,Vedant Deshpande,Ravindra Murumkar |
発行日 | 2023-11-30 17:26:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google