要約
TikTok や YouTube などのコンテンツ推奨システムでは、プラットフォームの推奨アルゴリズムがコンテンツ制作者のインセンティブを形成します。
現在制作されたコンテンツが将来のコンテンツの推奨に影響を与えるため、多くのプラットフォームではオンライン学習が採用されており、これにより異時点間のインセンティブが生成されます。
私たちはプロデューサー間のゲームを研究し、均衡状態で作成されたコンテンツを分析します。
私たちは、Hedge や EXP3 などの標準的なオンライン学習アルゴリズムは、残念ながらプロデューサーに低品質のコンテンツを作成するよう奨励しており、一般的な学習率スケジュールでは、長期的にはプロデューサーの労力がゼロに近づくことを示します。
この否定的な結果を動機として、私たちは生産者が多大な努力を投資し、高いユーザー福祉を達成するよう動機づける学習アルゴリズムを設計します。
概念的なレベルで、私たちの研究は、プラットフォームの学習アルゴリズムがコンテンツの品質に与える可能性のある意図しない影響を示し、これらの影響を軽減するためのアルゴリズムのアプローチを紹介します。
要約(オリジナル)
In content recommender systems such as TikTok and YouTube, the platform’s recommendation algorithm shapes content producer incentives. Many platforms employ online learning, which generates intertemporal incentives, since content produced today affects recommendations of future content. We study the game between producers and analyze the content created at equilibrium. We show that standard online learning algorithms, such as Hedge and EXP3, unfortunately incentivize producers to create low-quality content, where producers’ effort approaches zero in the long run for typical learning rate schedules. Motivated by this negative result, we design learning algorithms that incentivize producers to invest high effort and achieve high user welfare. At a conceptual level, our work illustrates the unintended impact that a platform’s learning algorithm can have on content quality and introduces algorithmic approaches to mitigating these effects.
arxiv情報
著者 | Xinyan Hu,Meena Jagadeesan,Michael I. Jordan,Jacob Steinhardt |
発行日 | 2024-06-21 14:39:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google