要約
大規模な電子商取引検索システムでは、テキスト クエリに対して高品質なアイテム想起を提供することが重要です。
現在の埋め込みベースの検索システム (ERS) は、クエリとアイテムを共有の低次元空間に埋め込みますが、ユニモダリティ ERS はテキストの特徴に大きく依存するため、複雑なコンテキストでは信頼性が低くなります。
マルチモダリティ ERS にはさまざまなデータ ソースが組み込まれていますが、さまざまなモダリティに対する個人の好みが見落とされることが多く、次善の結果につながります。
これらの問題に対処するために、私たちは、軽量の専門家混合 (LMoE) モジュールを通じてテキスト、項目画像、およびユーザーの好みを統合し、モダリティ間およびモダリティ内の機能をより適切に調整するマルチモダリティ検索システムである MRSE を提案します。
MRSE はまた、マルチモダリティ レベルでユーザー プロファイルを構築し、ハード ネガティブ サンプリングを使用して一貫性と堅牢性を強化する新しいハイブリッド損失関数を導入します。
Shopee の大規模なデータセットとオンライン A/B テストの実験により、MRSE は Shopee の最先端のユニモダリティ システムと比較して、オフライン関連性で 18.9% の向上、オンラインのコア指標で 3.7% の向上を達成したことが示されています。
要約(オリジナル)
Providing high-quality item recall for text queries is crucial in large-scale e-commerce search systems. Current Embedding-based Retrieval Systems (ERS) embed queries and items into a shared low-dimensional space, but uni-modality ERS rely too heavily on textual features, making them unreliable in complex contexts. While multi-modality ERS incorporate various data sources, they often overlook individual preferences for different modalities, leading to suboptimal results. To address these issues, we propose MRSE, a Multi-modality Retrieval System that integrates text, item images, and user preferences through lightweight mixture-of-expert (LMoE) modules to better align features across and within modalities. MRSE also builds user profiles at a multi-modality level and introduces a novel hybrid loss function that enhances consistency and robustness using hard negative sampling. Experiments on a large-scale dataset from Shopee and online A/B testing show that MRSE achieves an 18.9% improvement in offline relevance and a 3.7% gain in online core metrics compared to Shopee’s state-of-the-art uni-modality system.
arxiv情報
著者 | Hao Jiang,Haoxiang Zhang,Qingshan Hou,Chaofeng Chen,Weisi Lin,Jingchang Zhang,Annan Wang |
発行日 | 2024-08-27 11:21:19+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google