MemeGraphs: Linking Memes to Knowledge Graphs


ミームは、画像とテキストの様式を組み合わせて、ソーシャル メディアやインターネット全般でトレンドやアイデアを伝える一般的な形式です。
この研究では、オブジェクトとその視覚的関係に関して画像を表現するシーン グラフと、Transformer ベースのアーキテクチャによるミーム分類の構造化表現としてのナレッジ グラフの使用を提案します。
私たちは、ミームの(構造化された)表現のみを使用するマルチモーダル モデルである ImgBERT と私たちのアプローチを比較し、一貫した改善を観察しました。
さらに、ヒューマン グラフ アノテーションを備えたデータセットを提供し、自動生成されたグラフやエンティティ リンクと比較します。


Memes are a popular form of communicating trends and ideas in social media and on the internet in general, combining the modalities of images and text. They can express humor and sarcasm but can also have offensive content. Analyzing and classifying memes automatically is challenging since their interpretation relies on the understanding of visual elements, language, and background knowledge. Thus, it is important to meaningfully represent these sources and the interaction between them in order to classify a meme as a whole. In this work, we propose to use scene graphs, that express images in terms of objects and their visual relations, and knowledge graphs as structured representations for meme classification with a Transformer-based architecture. We compare our approach with ImgBERT, a multimodal model that uses only learned (instead of structured) representations of the meme, and observe consistent improvements. We further provide a dataset with human graph annotations that we compare to automatically generated graphs and entity linking. Analysis shows that automatic methods link more entities than human annotators and that automatically generated graphs are better suited for hatefulness classification in memes.


著者 Vasiliki Kougia,Simon Fetzel,Thomas Kirchmair,Erion Çano,Sina Moayed Baharlou,Sahand Sharifzadeh,Benjamin Roth
発行日 2023-06-26 16:15:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL, cs.CV, cs.LG パーマリンク