要約
スポーツの視聴者数を正確に予測することは、広告販売と収益予測を最適化するために非常に重要です。
Reddit などのソーシャル メディア プラットフォームは、視聴者のエンゲージメントや関心を反映したユーザー生成コンテンツを豊富に提供します。
この研究では、投稿数、コメント、スコア、TextBlob と VADER からのセンチメント分析などのソーシャル メディア メトリクスを使用して、スポーツの視聴者数を予測する回帰ベースのアプローチを提案します。
主要なスポーツのサブレディットに焦点を当て、カテゴリの特徴を組み込み、スポーツごとの外れ値を処理するなどの反復的な改善を通じて、モデルは $R^2$ 0.99、平均絶対誤差 (MAE) 127 万人の視聴者、および根平均を達成しました。
完全なデータセットにおける 233 万人の視聴者の二乗誤差 (RMSE)。
これらの結果は、視聴者の行動パターンを正確に捉えるモデルの能力を実証しており、イベント前の収益予測やターゲットを絞った広告戦略に大きな可能性をもたらします。
要約(オリジナル)
Accurately predicting sports viewership is crucial for optimizing ad sales and revenue forecasting. Social media platforms, such as Reddit, provide a wealth of user-generated content that reflects audience engagement and interest. In this study, we propose a regression-based approach to predict sports viewership using social media metrics, including post counts, comments, scores, and sentiment analysis from TextBlob and VADER. Through iterative improvements, such as focusing on major sports subreddits, incorporating categorical features, and handling outliers by sport, the model achieved an $R^2$ of 0.99, a Mean Absolute Error (MAE) of 1.27 million viewers, and a Root Mean Squared Error (RMSE) of 2.33 million viewers on the full dataset. These results demonstrate the model’s ability to accurately capture patterns in audience behavior, offering significant potential for pre-event revenue forecasting and targeted advertising strategies.
arxiv情報
著者 | Anakin Trotter |
発行日 | 2024-12-13 17:34:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google