Memotion 3: Dataset on sentiment and emotion analysis of codemixed Hindi-English Memes

要約

ミームは、ソーシャル メディア サイトにおけるユーモアの新時代の伝達メカニズムです。
多くの場合、ミームには画像とテキストが含まれます。
ミームは偽情報や憎悪を促進するために使用される可能性があるため、詳細に調査することが重要です。
Memotion 3 は、10,000 の注釈付きミームを含む新しいデータセットです。
Memotion の以前の反復を含むドメイン内の他の一般的なデータセットとは異なり、Memotion 3 はヒンディー語と英語のコード混合ミームを導入しますが、この分野の以前の作品は英語のミームのみに限定されていました。
Memotion タスク、データ収集、データセット作成の方法論について説明します。
また、タスクのベースラインも提供します。
ベースライン コードとデータセットは、https://github.com/Shreyashm16/Memotion-3.0 で利用できるようになります。

要約(オリジナル)

Memes are the new-age conveyance mechanism for humor on social media sites. Memes often include an image and some text. Memes can be used to promote disinformation or hatred, thus it is crucial to investigate in details. We introduce Memotion 3, a new dataset with 10,000 annotated memes. Unlike other prevalent datasets in the domain, including prior iterations of Memotion, Memotion 3 introduces Hindi-English Codemixed memes while prior works in the area were limited to only the English memes. We describe the Memotion task, the data collection and the dataset creation methodologies. We also provide a baseline for the task. The baseline code and dataset will be made available at https://github.com/Shreyashm16/Memotion-3.0

arxiv情報

著者 Shreyash Mishra,S Suryavardan,Parth Patwa,Megha Chakraborty,Anku Rani,Aishwarya Reganti,Aman Chadha,Amitava Das,Amit Sheth,Manoj Chinnakotla,Asif Ekbal,Srijan Kumar
発行日 2023-03-17 11:13:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク