要約
ミームのクラスタリングは、毒性検出、バイラリティモデリング、タイピングのために重要であるが、これまでの研究ではほとんど注目されてこなかった。類似するインターネットミームをクラスタリングすることは、そのマルチモーダリティ、文化的文脈、適応性のために困難である。既存のアプローチは、データベースに依存し、セマンティクスを見落とし、類似性の多様な次元を扱うのに苦労している。本論文では、多次元の類似性特徴を持つテンプレートベースのマッチングを使用することで、事前に定義されたデータベースの必要性を排除し、適応的なマッチングをサポートする新しい手法を紹介する。ミームは、形態、視覚的コンテンツ、テキスト、アイデンティティなどの類似性カテゴリにまたがる局所的および大域的特徴を用いてクラスタリングされる。また、類似性に基づく特徴セットは適応性を可能にし、人間の直感に沿う。後続の研究を支援するため、サポートする全てのコードを公開する。
要約(オリジナル)
Meme clustering is critical for toxicity detection, virality modeling, and typing, but it has received little attention in previous research. Clustering similar Internet memes is challenging due to their multimodality, cultural context, and adaptability. Existing approaches rely on databases, overlook semantics, and struggle to handle diverse dimensions of similarity. This paper introduces a novel method that uses template-based matching with multi-dimensional similarity features, thus eliminating the need for predefined databases and supporting adaptive matching. Memes are clustered using local and global features across similarity categories such as form, visual content, text, and identity. Our combined approach outperforms existing clustering methods, producing more consistent and coherent clusters, while similarity-based feature sets enable adaptability and align with human intuition. We make all supporting code publicly available to support subsequent research.
arxiv情報
| 著者 | Tygo Bloem,Filip Ilievski |
| 発行日 | 2025-05-02 07:34:59+00:00 |
| arxivサイト | arxiv_id(pdf) |