要約
ミームは、ソーシャル メディア サイト上でユーモアを伝達する新時代のメカニズムです。
ミームには画像とテキストが含まれることがよくあります。
ミームは偽情報や憎悪を助長するために使用される可能性があるため、詳細に調査することが重要です。
10,000 個の注釈付きミームを含む新しいデータセットである Memotion 3 を紹介します。
以前の Memotion のイテレーションを含む、このドメイン内で普及している他のデータセットとは異なり、Memotion 3 ではヒンディー語と英語のコード混合ミームが導入されていますが、この領域の以前の研究は英語ミームのみに限定されていました。
Memotion タスク、データ収集、データセット作成方法について説明します。
タスクのベースラインも提供します。
ベースライン コードとデータセットは https://github.com/Shreyashm16/Memotion-3.0 で利用可能になります。
要約(オリジナル)
Memes are the new-age conveyance mechanism for humor on social media sites. Memes often include an image and some text. Memes can be used to promote disinformation or hatred, thus it is crucial to investigate in details. We introduce Memotion 3, a new dataset with 10,000 annotated memes. Unlike other prevalent datasets in the domain, including prior iterations of Memotion, Memotion 3 introduces Hindi-English Codemixed memes while prior works in the area were limited to only the English memes. We describe the Memotion task, the data collection and the dataset creation methodologies. We also provide a baseline for the task. The baseline code and dataset will be made available at https://github.com/Shreyashm16/Memotion-3.0
arxiv情報
著者 | Shreyash Mishra,S Suryavardan,Parth Patwa,Megha Chakraborty,Anku Rani,Aishwarya Reganti,Aman Chadha,Amitava Das,Amit Sheth,Manoj Chinnakotla,Asif Ekbal,Srijan Kumar |
発行日 | 2023-10-02 14:28:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google