Crossing Boundaries: Leveraging Semantic Divergences to Explore Cultural Novelty in Cooking Recipes

要約

ノベルティモデリングと検出は、自然言語処理(NLP)の中心的なトピックであり、推奨システムや自動要約などの多くのタスクの中心です。
これには、以前に既知の情報から何らかの形で逸脱するテキストの識別を識別することが含まれます。
しかし、ノベルティは、各個人の世界の理解に基づいているため、経験の関連性と質の質のユニークな認識の重要な決定要因でもあります。
社会的要因、特に文化的背景は、目新しさと革新の認識に大きな影響を与えます。
文化的な目新しさは、異なるコミュニティ間の距離によって形作られるように、顕著性と目新しさの違いから生じます。
文化の多様性は人工知能(AI)の注目を集めていますが、文化的な斬新さを定量化するための堅牢な指標の欠如は、これらの相違のより深い理解を妨げます。
このギャップは、計算フレームワーク内の文化的な違いを定量化および理解することを制限します。
これに対処するために、社会学と管理からの知識を統合する学際的な枠組みを提案します。
私たちのアプローチの中心は、500皿と約100,000の調理レシピで構成される新しいデータセットであるGlobalFusionです。150か国以上からの文化的適応を獲得しています。
斬新さのためにジェンセンシャノンの分岐メトリックのセットを導入することにより、このデータセットを活用して、あるコミュニティからのレシピが別の文化的背景を持つ別のコミュニティによって変更されたときにテキストの発散を分析します。
結果は、私たちの文化的な斬新な指標と、言語的、宗教的、地理的距離に基づいた確立された文化的尺度との間に重要な相関関係を明らかにしています。
私たちの調査結果は、AIの文化的多様性の理解と測定を進めるための枠組みの可能性を強調しています。

要約(オリジナル)

Novelty modeling and detection is a core topic in Natural Language Processing (NLP), central to numerous tasks such as recommender systems and automatic summarization. It involves identifying pieces of text that deviate in some way from previously known information. However, novelty is also a crucial determinant of the unique perception of relevance and quality of an experience, as it rests upon each individual’s understanding of the world. Social factors, particularly cultural background, profoundly influence perceptions of novelty and innovation. Cultural novelty arises from differences in salience and novelty as shaped by the distance between distinct communities. While cultural diversity has garnered increasing attention in artificial intelligence (AI), the lack of robust metrics for quantifying cultural novelty hinders a deeper understanding of these divergences. This gap limits quantifying and understanding cultural differences within computational frameworks. To address this, we propose an interdisciplinary framework that integrates knowledge from sociology and management. Central to our approach is GlobalFusion, a novel dataset comprising 500 dishes and approximately 100,000 cooking recipes capturing cultural adaptation from over 150 countries. By introducing a set of Jensen-Shannon Divergence metrics for novelty, we leverage this dataset to analyze textual divergences when recipes from one community are modified by another with a different cultural background. The results reveal significant correlations between our cultural novelty metrics and established cultural measures based on linguistic, religious, and geographical distances. Our findings highlight the potential of our framework to advance the understanding and measurement of cultural diversity in AI.

arxiv情報

著者 Florian Carichon,Romain Rampa,Golnoosh Farnadi
発行日 2025-03-31 12:52:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク