Building Knowledge-Guided Lexica to Model Cultural Variation

要約

文化の違いは国家間(例:米国対中国)だけでなく、地域内(例:カリフォルニア対テキサス、ロサンゼルス対サンフランシスコ)にも存在します。
この地域的な文化の違いを測定することで、人々の考え方や行動がどのように、そしてなぜ異なるのかを明らかにすることができます。
歴史的には、トレーニング データの不足とスケーラビリティの制約により、文化的差異を計算によってモデル化することは困難でした。
この研究では、NLP コミュニティに新しい研究課題を導入します。それは、言語を使用して地域間の文化構造の変動をどのように測定するかということです。
次に、スケーラブルなソリューションを提供します。つまり、文化的差異をモデル化するための知識に基づいた語彙を構築し、NLP と文化的理解の交差点における将来の作業を奨励します。
また、現代の LLM が文化的差異を測定したり、文化的に多様な言語を生成したりしていないことも強調します。

要約(オリジナル)

Cultural variation exists between nations (e.g., the United States vs. China), but also within regions (e.g., California vs. Texas, Los Angeles vs. San Francisco). Measuring this regional cultural variation can illuminate how and why people think and behave differently. Historically, it has been difficult to computationally model cultural variation due to a lack of training data and scalability constraints. In this work, we introduce a new research problem for the NLP community: How do we measure variation in cultural constructs across regions using language? We then provide a scalable solution: building knowledge-guided lexica to model cultural variation, encouraging future work at the intersection of NLP and cultural understanding. We also highlight modern LLMs’ failure to measure cultural variation or generate culturally varied language.

arxiv情報

著者 Shreya Havaldar,Salvatore Giorgi,Sunny Rai,Young-Min Cho,Thomas Talhelm,Sharath Chandra Guntuku,Lyle Ungar
発行日 2024-10-14 16:13:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク