End-to-End Cost-Effective Incentive Recommendation under Budget Constraint with Uplift Modeling

要約

最新のオンライン プラットフォームでは、インセンティブはユーザー エンゲージメントを強化し、プラットフォームの収益を増加させる重要な要素です。
近年、個々の顧客にインセンティブを割り当てるための戦略的アプローチとして、アップリフト モデリングが導入されてきました。
特に多くの実世界のアプリケーションでは、オンライン プラットフォームは特定の予算制約がある顧客にのみインセンティブを与えることができます。
この問題は、複数選択ナップザック問題として再定式化できます。
この最適化の目的は、各顧客に最適なインセンティブを選択して投資収益率を最大化することです。
この分野の最近の研究では、2 段階のアプローチを使用して予算配分の問題に取り組むことがよくあります。
ただし、このソリューションは次の課題に直面します。 (1) 因果推論手法は、オンライン マーケティングにおけるドメイン知識を無視することがよくあります。オンライン マーケティングでは、インセンティブが増加するにつれて、顧客の期待される応答曲線は単調で滑らかになる必要があります。
(2) 2 つのステージ間の最適性ギャップにより、限られた予算制約の下で上昇予測に対するインセンティブ推奨情報が失われるため、次善の配分パフォーマンスが低下します。
これらの課題に対処するために、予算制約の下で新しいエンドツーエンドの費用対効果の高いインセンティブ推奨 (E3IR) モデルを提案します。
具体的には、私たちの方法は、隆起予測モジュールと微分可能割り当てモジュールの 2 つのモジュールで構成されます。
上昇予測モジュールでは、マーケティング領域の制約 (つまり、単調で滑らか) を使用して、隣接する治療間の増分改善を捉える予測ヘッドを構築します。
整数線形計画法 (ILP) を微分可能層入力として割り当てモジュールに組み込みます。
さらに、公開されている実際の製品データセットに対して広範な実験を実施し、E3IR が既存の 2 段階のアプローチと比較して割り当てパフォーマンスを向上させることを実証しています。

要約(オリジナル)

In modern online platforms, incentives are essential factors that enhance user engagement and increase platform revenue. Over recent years, uplift modeling has been introduced as a strategic approach to assign incentives to individual customers. Especially in many real-world applications, online platforms can only incentivize customers with specific budget constraints. This problem can be reformulated as the multi-choice knapsack problem. This optimization aims to select the optimal incentive for each customer to maximize the return on investment. Recent works in this field frequently tackle the budget allocation problem using a two-stage approach. However, this solution is confronted with the following challenges: (1) The causal inference methods often ignore the domain knowledge in online marketing, where the expected response curve of a customer should be monotonic and smooth as the incentive increases. (2) An optimality gap between the two stages results in inferior sub-optimal allocation performance due to the loss of the incentive recommendation information for the uplift prediction under the limited budget constraint. To address these challenges, we propose a novel End-to-End Cost-Effective Incentive Recommendation (E3IR) model under budget constraints. Specifically, our methods consist of two modules, i.e., the uplift prediction module and the differentiable allocation module. In the uplift prediction module, we construct prediction heads to capture the incremental improvement between adjacent treatments with the marketing domain constraints (i.e., monotonic and smooth). We incorporate integer linear programming (ILP) as a differentiable layer input in the allocation module. Furthermore, we conduct extensive experiments on public and real product datasets, demonstrating that our E3IR improves allocation performance compared to existing two-stage approaches.

arxiv情報

著者 Zexu Sun,Hao Yang an Dugang Liu,Yunpeng Weng,Xing Tang,Xiuqiang He
発行日 2024-08-21 13:48:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IR, cs.LG パーマリンク