Light-weight End-to-End Graph Interest Network for CTR Prediction in E-commerce Search

要約

クリックスルー率 (CTR) の予測は、e コマース検索におけるユーザー エクスペリエンスと収益の向上に重要な影響を与えます。
深層学習の発展に伴い、ユーザーの行動やその他の情報から抽出されたグラフ構造を利用して学習の埋め込みを支援するために、グラフベースの手法がうまく活用されています。
ただし、以前のグラフベースの方法のほとんどは主に推奨シナリオに焦点を当てているため、そのグラフ構造はユーザーの行動からのアイテムの逐次情報に大きく依存し、クエリの逐次信号やクエリとアイテムの相関関係は無視されます。
このペーパーでは、ユーザーの検索関心を効果的に掘り起こし、これまでの課題に取り組むための、軽量エンドツーエンド グラフ インタレスト ネットワーク (EGIN) と呼ばれる新しいアプローチを提案します。
(i) EGIN は、クエリとアイテムの相関関係と検索システムからの連続情報を利用して、電子商取引検索における CTR 予測を改善するための異種グラフを構築します。
(ii) EGIN のグラフ埋め込み学習は同じトレーニング入力を共有し、CTR 予測と共同でトレーニングされるため、エンドツーエンドのフレームワークを大規模な検索システムに簡単に導入できます。
提案された EGIN は、クエリ項目異種グラフ、軽量グラフ サンプリング、およびマルチインタレスト ネットワークの 3 つの部分で構成されます。
クエリ項目異種グラフは、提案された軽量グラフ サンプリングによってクエリと項目の相関情報と逐次情報を効率的に取得します。
マルチインタレスト ネットワークは、グラフの埋め込みを利用してクエリとアイテム間のさまざまな類似関係をキャプチャし、最終的な CTR 予測を強化するように適切に設計されています。
私たちは、提案されている EGIN の有効性を実証するために、公共データセットと産業データセットの両方で広範な実験を実施しています。
同時に、グラフ学習のトレーニング コストは主要な CTR 予測タスクに比べて比較的低く、実際のアプリケーションでの効率を確保します。

要約(オリジナル)

Click-through-rate (CTR) prediction has an essential impact on improving user experience and revenue in e-commerce search. With the development of deep learning, graph-based methods are well exploited to utilize graph structure extracted from user behaviors and other information to help embedding learning. However, most of the previous graph-based methods mainly focus on recommendation scenarios, and therefore their graph structures highly depend on item’s sequential information from user behaviors, ignoring query’s sequential signal and query-item correlation. In this paper, we propose a new approach named Light-weight End-to-End Graph Interest Network (EGIN) to effectively mine users’ search interests and tackle previous challenges. (i) EGIN utilizes query and item’s correlation and sequential information from the search system to build a heterogeneous graph for better CTR prediction in e-commerce search. (ii) EGIN’s graph embedding learning shares the same training input and is jointly trained with CTR prediction, making the end-to-end framework effortless to deploy in large-scale search systems. The proposed EGIN is composed of three parts: query-item heterogeneous graph, light-weight graph sampling, and multi-interest network. The query-item heterogeneous graph captures correlation and sequential information of query and item efficiently by the proposed light-weight graph sampling. The multi-interest network is well designed to utilize graph embedding to capture various similarity relationships between query and item to enhance the final CTR prediction. We conduct extensive experiments on both public and industrial datasets to demonstrate the effectiveness of the proposed EGIN. At the same time, the training cost of graph learning is relatively low compared with the main CTR prediction task, ensuring efficiency in practical applications.

arxiv情報

著者 Pai Peng,Quanxiang Jia,Ziqiang Zhou,Shuang Hong,Zichong Xiao
発行日 2024-06-25 17:31:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.IR, cs.LG, H.3.3 パーマリンク