Quantification of Biodiversity from Historical Survey Text with LLM-based Best-Worst Scaling

要約

この研究では、履歴調査テキストからの量推定を介して種の頻度を決定する方法を評価します。
そのために、分類タスクを策定し、最終的にこの問題が、大規模な言語モデル(LLMS)を備えたBest-Worst Scaling(BWS)を使用して回帰タスクとして適切にフレーム化できることを示します。
Ministral-8B、Deepseek-V3、およびGPT-4をテストし、後者の2つが人間と互いと合理的な一致を持っていることを発見しました。
このアプローチはより費用対効果が高く、細粒のマルチクラスアプローチと比較して同様に堅牢であり、種間で自動化された数量推定を可能にすると結論付けています。

要約(オリジナル)

In this study, we evaluate methods to determine the frequency of species via quantity estimation from historical survey text. To that end, we formulate classification tasks and finally show that this problem can be adequately framed as a regression task using Best-Worst Scaling (BWS) with Large Language Models (LLMs). We test Ministral-8B, DeepSeek-V3, and GPT-4, finding that the latter two have reasonable agreement with humans and each other. We conclude that this approach is more cost-effective and similarly robust compared to a fine-grained multi-class approach, allowing automated quantity estimation across species.

arxiv情報

著者 Thomas Haider,Tobias Perschl,Malte Rehbein
発行日 2025-02-06 12:25:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL | Quantification of Biodiversity from Historical Survey Text with LLM-based Best-Worst Scaling はコメントを受け付けていません

Had enough of experts? Quantitative knowledge retrieval from large language models

要約

大規模な言語モデル(LLM)は、説得力のある自然言語シーケンスを生成する能力のために広範囲に研究されていますが、定量的な情報検索の有用性はあまり理解されていません。
ここでは、2つのデータ分析タスクを支援するための定量的知識検索のメカニズムとしてのLLMの実現可能性を調査します。
専門家のような事前知識を引き出し、欠落データを帰属させることにより、ベイジアンワークフローを強化するためにLLMを活用するフレームワークを紹介します。
多様なデータセットでテストされたこのアプローチは、予測精度を改善し、データ要件を削減し、ヘルスケア、環境科学、工学アプリケーションの大きな可能性を提供します。
LLMを「専門家」として扱うことの意味と課題について説明します。

要約(オリジナル)

Large language models (LLMs) have been extensively studied for their abilities to generate convincing natural language sequences, however their utility for quantitative information retrieval is less well understood. Here we explore the feasibility of LLMs as a mechanism for quantitative knowledge retrieval to aid two data analysis tasks: elicitation of prior distributions for Bayesian models and imputation of missing data. We introduce a framework that leverages LLMs to enhance Bayesian workflows by eliciting expert-like prior knowledge and imputing missing data. Tested on diverse datasets, this approach can improve predictive accuracy and reduce data requirements, offering significant potential in healthcare, environmental science and engineering applications. We discuss the implications and challenges of treating LLMs as ‘experts’.

arxiv情報

著者 David Selby,Kai Spriestersbach,Yuichiro Iwashita,Mohammad Saad,Dennis Bappert,Archana Warrier,Sumantrak Mukherjee,Koichi Kise,Sebastian Vollmer
発行日 2025-02-06 12:52:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR, stat.AP | Had enough of experts? Quantitative knowledge retrieval from large language models はコメントを受け付けていません

Exploring Imbalanced Annotations for Effective In-Context Learning

要約

大規模な言語モデル(LLMS)は、注釈付きデータセットから選択されたデモに大きく依存しているコンテキスト学習(ICL)を通じて、ダウンストリームタスクで印象的なパフォーマンスを示しています。
既存の選択方法は、注釈付きのデータセットの分布にかかっている可能性があります。これは、多くの場合、実際のシナリオで長期尾を置くことができます。
この作業では、注釈付きデータセットの不均衡なクラス分布が、さまざまなタスクと選択方法にわたるICLのパフォーマンスを大幅に低下させることを示します。
さらに、従来のリバランス方法は、ICLのクラスの不均衡の問題を改善することができません。
私たちの方法は、注釈付きデータセットとテストデータセットの分布の違いを2成分の重み、クラスごとの重みと条件付きバイアスに分解することにより動機付けられています。
私たちの方法の背後にある重要なアイデアは、バランスの取れた検証データセットの経験的エラーを最小限に抑えて条件付きバイアスを推定し、2成分の重みを使用して選択中の元のスコアリング関数を変更することです。
私たちのアプローチは、元の選択方法の有効性を維持しながら、単一のクラスからあまりにも多くのデモンストレーションを選択するのを防ぐことができます。
広範な実験は、私たちの方法の有効性を実証し、不均衡なデータセットを使用した一般的なベンチマークで平均精度を最大5.46に改善します。

要約(オリジナル)

Large language models (LLMs) have shown impressive performance on downstream tasks through in-context learning (ICL), which heavily relies on the demonstrations selected from annotated datasets. Existing selection methods may hinge on the distribution of annotated datasets, which can often be long-tailed in real-world scenarios. In this work, we show that imbalanced class distributions in annotated datasets significantly degrade the performance of ICL across various tasks and selection methods. Moreover, traditional rebalance methods fail to ameliorate the issue of class imbalance in ICL. Our method is motivated by decomposing the distributional differences between annotated and test datasets into two-component weights: class-wise weights and conditional bias. The key idea behind our method is to estimate the conditional bias by minimizing the empirical error on a balanced validation dataset and to employ the two-component weights to modify the original scoring functions during selection. Our approach can prevent selecting too many demonstrations from a single class while preserving the effectiveness of the original selection methods. Extensive experiments demonstrate the effectiveness of our method, improving the average accuracy by up to 5.46 on common benchmarks with imbalanced datasets.

arxiv情報

著者 Hongfu Gao,Feipeng Zhang,Hao Zeng,Deyu Meng,Bingyi Jing,Hongxin Wei
発行日 2025-02-06 12:57:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG | Exploring Imbalanced Annotations for Effective In-Context Learning はコメントを受け付けていません

Simulating the Emergence of Differential Case Marking with Communicating Neural-Network Agents

要約

微分ケースマーキング(DCM)とは、セマンティック、プラグマティック、またはその他の要因に基づいて、文法のケースマーキングが選択的に適用される現象を指します。
DCMの出現は、人間の参加者との人工言語学習実験で研究されてきました。これは、コミュニケーションの学習の影響を解き放つことを特に目的としていました(Smith&Culbertson、2020)。
ニューラルネットワークに基づいたマルチエージェント強化学習フレームワークは、人間のような言語現象の出現をシミュレートするために大きな関心を抱いています。
この研究では、コミュニケーションの相互作用に従事する前にエージェントが最初に人工言語を取得し、人間の結果と直接比較できるようなフレームワークを採用しています。
言語やセマンティックの好みの経験がない非常に一般的なコミュニケーション最適化アルゴリズムとニューラルネットワーク学習者を使用して、我々の結果は、学習だけではDCMにつながるわけではないが、エージェントが通信するとマーカーの差別的使用が発生することを示しています。
これは、DCMの形成におけるコミュニケーションの重要な役割を強調するスミスとカルバートソン(2020)の発見をサポートし、言語の進化に関する実験的研究を補完する神経エージェントモデルの可能性を示しています。

要約(オリジナル)

Differential Case Marking (DCM) refers to the phenomenon where grammatical case marking is applied selectively based on semantic, pragmatic, or other factors. The emergence of DCM has been studied in artificial language learning experiments with human participants, which were specifically aimed at disentangling the effects of learning from those of communication (Smith & Culbertson, 2020). Multi-agent reinforcement learning frameworks based on neural networks have gained significant interest to simulate the emergence of human-like linguistic phenomena. In this study, we employ such a framework in which agents first acquire an artificial language before engaging in communicative interactions, enabling direct comparisons to human result. Using a very generic communication optimization algorithm and neural-network learners that have no prior experience with language or semantic preferences, our results demonstrate that learning alone does not lead to DCM, but when agents communicate, differential use of markers arises. This supports Smith and Culbertson (2020)’s findings that highlight the critical role of communication in shaping DCM and showcases the potential of neural-agent models to complement experimental research on language evolution.

arxiv情報

著者 Yuchen Lian,Arianna Bisazza,Tessa Verhoef
発行日 2025-02-06 13:00:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL | Simulating the Emergence of Differential Case Marking with Communicating Neural-Network Agents はコメントを受け付けていません

Leveraging Reasoning with Guidelines to Elicit and Utilize Knowledge for Enhancing Safety Alignment

要約

安全なLLMSのトレーニングは、最も重要な研究課題の1つです。
ただし、一般的に使用される方法である拒否トレーニング(RT)は、さまざまなOODのジェイルブレイク攻撃に一般化するのに苦労しています。
この問題に対処するために、多くの安全トレーニング方法が提案されています。
彼らは貴重な洞察を提供しますが、OOD攻撃がRTモデルの能力を本当に超えているかどうかを調査することにより、この一連の研究を補完することを目指しています。
Bonで評価を実施すると、Nが増加するにつれて一般化に関する大幅な改善が観察されます。
これは、モデルが十分な安全性関連の潜在的な知識を持っていることを強調していますが、RTはOOD攻撃に対処する際にこの知識を一貫して引き出すことができません。
ドメインの適応に基づくさらなる分析により、直接的な拒否によるトレーニングにより、モデルが表面的なショートカットに依存し、非ロバスト表現マッピングの学習が生じることが明らかになりました。
調査結果に基づいて、各クエリの安全推論を実行するためのトレーニングモデルを提案します。
推論監督は、モデルがより多くの計算を実行することを奨励し、推論を通じて明示的に誘発し、潜在的な知識を使用することを奨励します。
これを達成するために、私たちは前のガイドラインに基づいて推論監督を統合し、モデルをそれらと連携させるためにモデルをトレーニングし、それによって多様な観点から潜在的な知識を効果的に誘発し、利用します。
広範な実験は、私たちの方法がOOD攻撃に対する一般化パフォーマンスを大幅に改善することを示しています。

要約(オリジナル)

Training safe LLMs is one of the most critical research challenge. However, the commonly used method, Refusal Training (RT), struggles to generalize against various OOD jailbreaking attacks. Many safety training methods have been proposed to address this issue. While they offer valuable insights, we aim to complement this line of research by investigating whether OOD attacks truly exceed the capability of RT model. Conducting evaluation with BoN, we observe significant improvements on generalization as N increases. This underscores that the model possesses sufficient safety-related latent knowledge, but RT fails to consistently elicit this knowledge when addressing OOD attacks. Further analysis based on domain adaptation reveals that training with direct refusal causes model to rely on superficial shortcuts, resulting in learning of non-robust representation mappings. Based on our findings, we propose training model to perform safety reasoning for each query. Reasoning supervision encourages model to perform more computations, explicitly eliciting and using latent knowledge through reasoning. To achieve this, we synthesize reasoning supervision based on pre-guidelines, training the model to reason in alignment with them, thereby effectively eliciting and utilizing latent knowledge from diverse perspectives. Extensive experiments show that our method significantly improves generalization performance against OOD attacks.

arxiv情報

著者 Haoyu Wang,Zeyu Qin,Li Shen,Xueqian Wang,Minhao Cheng,Dacheng Tao
発行日 2025-02-06 13:01:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG | Leveraging Reasoning with Guidelines to Elicit and Utilize Knowledge for Enhancing Safety Alignment はコメントを受け付けていません

Root Defence Strategies: Ensuring Safety of LLM at the Decoding Level

要約

大規模な言語モデル(LLM)は、さまざまな業界で膨大な効用を実証しています。
ただし、LLMSが進むにつれて、誤ったまたは悪意のある命令プロンプトにより、有害な出力のリスクが増加します。
現在の方法は脱獄リスクに効果的に対処しますが、共通の制限を共有しています。1)プレフィルレベルからの有害な反応の判断は、モデルのデコード出力の利用を欠いており、比較的低い有効性と堅牢性をもたらします。
2)単一の評価に基づいて潜在的に有害な回答を拒否すると、モデルの有用性が大幅に損なわれる可能性があります。この論文では、有害な出力を認識するLLMの能力を調べ、以前のトークンの危険性を評価する習熟度を明らかにし、定量化します。
パイロット実験結果に動機付けられ、デコードレベルで堅牢な防御メカニズムを設計します。
私たちの新しいデコーダー指向のステップバイステップの防衛アーキテクチャは、完全に拒否するのではなく、有害なクエリを直接修正します。
ユーザビリティを向上させ、展開を容易にして安全なデコード速度を高めるための投機的デコードを導入します。
広範な実験は、私たちのアプローチが推論速度を損なうことなくモデルのセキュリティを改善することを示しています。
特に、当社の方法は、危険な情報を識別するモデルの能力を活用し、既存の方法と比較してその有用性を維持します。

要約(オリジナル)

Large language models (LLMs) have demonstrated immense utility across various industries. However, as LLMs advance, the risk of harmful outputs increases due to incorrect or malicious instruction prompts. While current methods effectively address jailbreak risks, they share common limitations: 1) Judging harmful responses from the prefill-level lacks utilization of the model’s decoding outputs, leading to relatively lower effectiveness and robustness. 2) Rejecting potentially harmful responses based on a single evaluation can significantly impair the model’s helpfulness.This paper examines the LLMs’ capability to recognize harmful outputs, revealing and quantifying their proficiency in assessing the danger of previous tokens. Motivated by pilot experiment results, we design a robust defense mechanism at the decoding level. Our novel decoder-oriented, step-by-step defense architecture corrects harmful queries directly rather than rejecting them outright. We introduce speculative decoding to enhance usability and facilitate deployment to boost secure decoding speed. Extensive experiments demonstrate that our approach improves model security without compromising reasoning speed. Notably, our method leverages the model’s ability to discern hazardous information, maintaining its helpfulness compared to existing methods.

arxiv情報

著者 Xinyi Zeng,Yuying Shang,Jiawei Chen,Jingyuan Zhang,Yu Tian
発行日 2025-02-06 13:21:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CR | Root Defence Strategies: Ensuring Safety of LLM at the Decoding Level はコメントを受け付けていません

Predicting Large Language Model Capabilities on Closed-Book QA Tasks Using Only Information Available Prior to Training

要約

OpenAIのGPT-4テクニカルレポートは、方法論が不特定のままであるにもかかわらず、特定のタスクのモデルパフォーマンスをトレーニング前に予測できることを示唆しています。
このアプローチは、リソースの割り当てを最適化し、ターゲットタスクとのデータの調整を確保するために重要です。
このビジョンを達成するために、トレーニング前のデータと知識保持に密接に結びついているクローズドブック質問応答(CBQA)タスクのパフォーマンスの予測に焦点を当てています。
次の3つの主要な課題に対処します。1)トレーニング前のプロセス全体、特にデータ構築をマスターする。
2)モデルの知識保持の評価。
3)トレーニング前に利用可能な情報のみを使用して、タスク固有の知識保持を予測する。
これらの課題に取り組むために、560Kドルと520K GPU時間を使用して、3つの大きな言語モデル(つまり、1.6b、7b、および13b)を事前訓練します。
知識トリプルでトレーニング前のデータを分析し、確立された方法を使用して知識保持を評価します。
さらに、トレーニング前のデータ、モデルサイズ、およびタスク固有の知識保持との関係を定量化する情報理論的尺度であるSMIメトリックを紹介します。
私たちの実験は、SMIメトリックとさまざまなサイズのモデル全体でCBQAタスクのモデルの精度との間の強い線形相関($ \ Text {r}^2> 0.84 $)を明らかにしています(すなわち、1.1b、1.6b、7b、および13b)

データセット、モデル、およびコードは、https://github.com/yuhui1038/smiで入手できます。

要約(オリジナル)

The GPT-4 technical report from OpenAI suggests that model performance on specific tasks can be predicted prior to training, though methodologies remain unspecified. This approach is crucial for optimizing resource allocation and ensuring data alignment with target tasks. To achieve this vision, we focus on predicting performance on Closed-book Question Answering (CBQA) tasks, which are closely tied to pre-training data and knowledge retention. We address three major challenges: 1) mastering the entire pre-training process, especially data construction; 2) evaluating a model’s knowledge retention; and 3) predicting task-specific knowledge retention using only information available prior to training. To tackle these challenges, we pre-train three large language models (i.e., 1.6B, 7B, and 13B) using 560k dollars and 520k GPU hours. We analyze the pre-training data with knowledge triples and assess knowledge retention using established methods. Additionally, we introduce the SMI metric, an information-theoretic measure that quantifies the relationship between pre-training data, model size, and task-specific knowledge retention. Our experiments reveal a strong linear correlation ($\text{R}^2 > 0.84$) between the SMI metric and the model’s accuracy on CBQA tasks across models of varying sizes (i.e., 1.1B, 1.6B, 7B, and 13B). The dataset, model, and code are available at https://github.com/yuhui1038/SMI.

arxiv情報

著者 Changhao Jiang,Ming Zhang,Junjie Ye,Xiaoran Fan,Yifei Cao,Jiajun Sun,Zhiheng Xi,Shihan Dou,Yi Dong,Yujiong Shen,Jingqi Tong,Zhen Wang,Tao Liang,Zhihui Fei,Mingyang Wan,Guojun Ma,Qi Zhang,Tao Gui,Xuanjing Huang
発行日 2025-02-06 13:23:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL | Predicting Large Language Model Capabilities on Closed-Book QA Tasks Using Only Information Available Prior to Training はコメントを受け付けていません

Controllable Emotion Generation with Emotion Vectors

要約

近年、大規模な言語モデル(LLMS)に基づくテクノロジーは、特に顧客サービス、コンテンツの作成、具体化されたインテリジェンスで、多くの分野で顕著な進歩を遂げ、幅広いアプリケーションの可能性を示しています。
ただし、適切なトーン、タイミング、および直接的および間接的な形態の両方で感情を表現するLLMの能力は依然として不十分ですが重要です。
LLMSの制御可能な感情表現能力を構築する方法について研究した作品はほとんどありません。
この作業では、LLMSによる感情表現出力の方法を提案します。LLMSは、広範な実験と検証で普遍的で非常に柔軟で、適切に制御可能であることが証明されています。
この方法には、インテリジェントな顧客サービス、文学の作成、ホームコンパニオンロボットなど、LLMSによる感情出力を含む分野で幅広いアプリケーションの見通しがあります。
さまざまなモデルスケールとアーキテクチャを備えたさまざまなLLMに関する広範な実験は、提案された方法の汎用性と有効性を証明します。

要約(オリジナル)

In recent years, technologies based on large-scale language models (LLMs) have made remarkable progress in many fields, especially in customer service, content creation, and embodied intelligence, showing broad application potential. However, The LLM’s ability to express emotions with proper tone, timing, and in both direct and indirect forms is still insufficient but significant. Few works have studied on how to build the controlable emotional expression capability of LLMs. In this work, we propose a method for emotion expression output by LLMs, which is universal, highly flexible, and well controllable proved with the extensive experiments and verifications. This method has broad application prospects in fields involving emotions output by LLMs, such as intelligent customer service, literary creation, and home companion robots. The extensive experiments on various LLMs with different model-scales and architectures prove the versatility and the effectiveness of the proposed method.

arxiv情報

著者 Yurui Dong,Luozhijie Jin,Yao Yang,Bingjie Lu,Jiaxi Yang,Zhi Liu
発行日 2025-02-06 13:38:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL | Controllable Emotion Generation with Emotion Vectors はコメントを受け付けていません

AttentionPredictor: Temporal Pattern Matters for Efficient LLM Inference

要約

大規模な言語モデル(LLMS)の開発により、キー値(kV)キャッシュ圧縮による効率的な推論は、特に長いコンテストの生成にかなりの注目を集めています。
KVキャッシュを圧縮するために、最近のメソッドは、注意スコアでヒューリスティックなランキングを通じて重要なKVトークンを特定します。
ただし、これらの方法は、注意スコアの\ textit {時間パターン}を無視して、LLMパフォーマンスで顕著な分解をもたらすため、重要なトークンを正確に決定するのに苦労しています。
この課題に対処するために、最初の学習ベースの重要なトークン識別アプローチであるAttentionPredictorを提案します。
具体的には、AttentionPredictorは軽量の畳み込みモデルを学習して、時空間パターンをキャプチャし、次のトークンの注意スコアを予測します。
AttentionPredictorの魅力的な機能は、無視できるメモリを消費しながら注意スコアを正確に予測することです。
さらに、トークンの推定時間のオーバーヘッドを隠してデコード段階を加速するクロストークンのクリティカルキャッシュプリフェッチフレームワークを提案します。
注意情報のほとんどを保持することにより、AttentionPredictorは、同等のLLMパフォーマンスで16 $ \ Times $ KVキャッシュ圧縮を達成し、最先端を大幅に上回ります。

要約(オリジナル)

With the development of large language models (LLMs), efficient inference through Key-Value (KV) cache compression has attracted considerable attention, especially for long-context generation. To compress the KV cache, recent methods identify critical KV tokens through heuristic ranking with attention scores. However, these methods often struggle to accurately determine critical tokens as they neglect the \textit{temporal patterns} in attention scores, resulting in a noticeable degradation in LLM performance. To address this challenge, we propose AttentionPredictor, which is the first learning-based critical token identification approach. Specifically, AttentionPredictor learns a lightweight convolution model to capture spatiotemporal patterns and predict the next-token attention score. An appealing feature of AttentionPredictor is that it accurately predicts the attention score while consuming negligible memory. Moreover, we propose a cross-token critical cache prefetching framework that hides the token estimation time overhead to accelerate the decoding stage. By retaining most of the attention information, AttentionPredictor achieves 16$\times$ KV cache compression with comparable LLM performance, significantly outperforming the state-of-the-art.

arxiv情報

著者 Qingyue Yang,Jie Wang,Xing Li,Zhihai Wang,Chen Chen,Lei Chen,Xianzhi Yu,Wulong Liu,Jianye Hao,Mingxuan Yuan,Bin Li
発行日 2025-02-06 13:41:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG | AttentionPredictor: Temporal Pattern Matters for Efficient LLM Inference はコメントを受け付けていません

The Role of Network and Identity in the Diffusion of Hashtags

要約

文化のオンラインの拡散は、多くの相互作用する社会的要因(ネットワークやアイデンティティなど)の影響を受けると理論付けられています。
ただし、ほとんどの既存の計算カスケードモデルは、単一の要因(ネットワークやアイデンティティなど)のみを考慮しています。
この作業は、ハッシュタグカスケードの根底にあるメカニズムを引き裂くための新しいフレームワークを提供します。
文化的革新をオンラインで表す1,337のハッシュタグの新しいデータセットをキュレートし、経験的カスケードとシミュレートされたカスケードを比較するための10因子評価フレームワークを開発し、ネットワーク+アイデンティティモデルがネットワークまたはアイデンティティのみの反事実よりもハッシュタグカスケードをよりよくシミュレートすることを示します。
また、パフォーマンスの不均一性も探求します。ネットワーク+アイデンティティモデルを組み合わせてカスケードの人気を最もよく予測しますが、ネットワークのみのモデルはカスケードの成長を最もよく予測し、アイデンティティのみのモデルが採用の構成を最もよく予測します。
ネットワーク+アイデンティティモデルは、人種的または地域的なアイデンティティを表現し、スポーツやニュースについて話すために使用されるハッシュタグの中で最も高い比較優位性を持っています。
実際、各ハッシュタグのネットワークおよび/またはアイデンティティの最適なモデルの組み合わせを予測し、これを使用してパフォーマンスをさらに向上させることができます。
私たちの結果は、ソーシャルメディアでのハッシュタグの拡散にネットワーク、アイデンティティ、およびその他の社会的要因の相互作用を組み込んだモデルの有用性を示しています。

要約(オリジナル)

The diffusion of culture online is theorized to be influenced by many interacting social factors (e.g., network and identity). However, most existing computational cascade models consider just a single factor (e.g., network or identity). This work offers a new framework for teasing apart the mechanisms underlying hashtag cascades. We curate a new dataset of 1,337 hashtags representing cultural innovation online, develop a 10-factor evaluation framework for comparing empirical and simulated cascades, and show that a combined network+identity model better simulates hashtag cascades than network- or identity-only counterfactuals. We also explore heterogeneity in performance: While a combined network+identity model best predicts the popularity of cascades, a network-only model best predicts cascade growth and an identity-only model best predicts adopter composition. The network+identity model has the highest comparative advantage among hashtags used for expressing racial or regional identity and talking about sports or news. In fact, we are able to predict what combination of network and/or identity best models each hashtag and use this to further improve performance. Our results show the utility of models incorporating the interactions of network, identity, and other social factors in the diffusion of hashtags in social media.

arxiv情報

著者 Aparna Ananthasubramaniam,Yufei ‘Louise’ Zhu,David Jurgens,Daniel Romero
発行日 2025-02-06 13:42:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CY, cs.SI | The Role of Network and Identity in the Diffusion of Hashtags はコメントを受け付けていません