要約
埋め込みベースのニューラル検索は、末尾クエリでの製品検索でよく発生するセマンティック ギャップ問題に対処するための一般的なアプローチです。
対照的に、一般的なクエリにはコンテキストがなく、ユーザーの過去のインタラクションから得られる追加のコンテキストが役立つ幅広い意図を持っています。
この論文では、セマンティック ギャップ問題とそれに続くパーソナライズされたセマンティック検索のためのエンドツーエンドのトレーニング済みモデルの両方に対処するための新しいアプローチを共有します。
私たちは、グラフ、トランスフォーマー、用語ベースの埋め込みをエンドツーエンドで組み込んだ統合埋め込みモデルを学習することを提案し、パフォーマンスと効率の間の最適なトレードオフのための設計の選択肢を共有します。
私たちは、検索の関連性を向上させ、そのようなモデルを業界規模で展開するための新しい事前トレーニング戦略やその他のトリックを含む、特徴量エンジニアリング、ハード ネガティブ サンプリング戦略、およびトランスフォーマー モデルの応用に関する学習を共有します。
当社のパーソナライズされた検索モデルは、ライブトラフィックにおける複数の A/B テストを集計して、検索購入率の 5.58% 増加とサイト全体のコンバージョン率の 2.63% 増加によって測定されるように、全体的な検索エクスペリエンスを大幅に向上させます。
要約(オリジナル)
Embedding-based neural retrieval is a prevalent approach to address the semantic gap problem which often arises in product search on tail queries. In contrast, popular queries typically lack context and have a broad intent where additional context from users historical interaction can be helpful. In this paper, we share our novel approach to address both: the semantic gap problem followed by an end to end trained model for personalized semantic retrieval. We propose learning a unified embedding model incorporating graph, transformer and term-based embeddings end to end and share our design choices for optimal tradeoff between performance and efficiency. We share our learnings in feature engineering, hard negative sampling strategy, and application of transformer model, including a novel pre-training strategy and other tricks for improving search relevance and deploying such a model at industry scale. Our personalized retrieval model significantly improves the overall search experience, as measured by a 5.58% increase in search purchase rate and a 2.63% increase in site-wide conversion rate, aggregated across multiple A/B tests – on live traffic.
arxiv情報
| 著者 | Rishikesh Jha,Siddharth Subramaniyam,Ethan Benjamin,Thrivikrama Taula | 
| 発行日 | 2024-09-25 17:01:50+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, Google
