High-Dimensional Tail Index Regression: with An Application to Text Analyses of Viral Posts in Social Media

要約

ソーシャルメディアにおけるバイラル投稿のクレジット(例えば「いいね!」の数)分布の経験的べき乗則に動機づけられ、高次元尾部指数回帰とそのパラメータの推定・推論方法を紹介する。正則化推定量を提案し、その一貫性を確立し、その収束率を導出する。推論を行うために、正則化された推定値をデビアスすることを提案し、デビアスされた推定値の漸近正規性を確立する。シミュレーション研究は我々の理論を支持する。これらの方法は、X(旧Twitter)におけるLGBTQ+に関するバイラル投稿のテキスト分析に適用される。

要約(オリジナル)

Motivated by the empirical power law of the distributions of credits (e.g., the number of ‘likes’) of viral posts in social media, we introduce the high-dimensional tail index regression and methods of estimation and inference for its parameters. We propose a regularized estimator, establish its consistency, and derive its convergence rate. To conduct inference, we propose to debias the regularized estimate, and establish the asymptotic normality of the debiased estimator. Simulation studies support our theory. These methods are applied to text analyses of viral posts in X (formerly Twitter) concerning LGBTQ+.

arxiv情報

著者 Yuya Sasaki,Jing Tao,Yulong Wang
発行日 2024-03-02 21:37:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, econ.EM, stat.ML パーマリンク