要約
テキスト マッチング システムは、ほとんどの検索プラットフォームの基本サービスとなっています。
たとえば、ユーザーのクエリを関連する候補項目と照合したり、検索エクスペリエンスを向上させるためにユーザー入力のクエリを事前に選択された高パフォーマンスのクエリに書き換えたりする責任があります。
実際には、クエリとアイテムの両方に、アイテムのカテゴリやクエリで言及されている場所などの複数の属性が含まれることが多く、これらは照合に役立つ凝縮されたキー情報を表します。
しかし、既存の作品のほとんどは、属性を補足情報としてテキスト表現に統合することにより、属性の有効性を軽視しています。
したがって、この研究では、属性間の関係を 2 つの側面から探ることに焦点を当てます。
両端からの属性は数とタイプの点で一致していないことが多いため、マルチインテント モデリングによって属性の利点を活用することを提案します。
属性から抽出されたインテントは、クエリの多様なニーズを要約し、より洗練された抽象的なアイテムの豊富なコンテンツを提供し、ペアの入力に合わせて調整できます。
具体的には、マルチインテント属性認識マッチング モデル (MIM) を提案します。これは、属性認識エンコーダー、マルチインテント モデリング、およびインテント認識マッチングの 3 つの主要コンポーネントで構成されます。
属性認識エンコーダでは、テキストと属性は、属性の重要性に関してスケールされたアテンション メカニズムを通じて重み付けされ、処理されます。
その後、マルチインテント モデリングによって両端からインテントが抽出され、それらが調整されます。
ここでは、学習された意図が多様であるが集中していることを保証するための分布損失と、学習された意図を揃えるカルバック・ライブラー発散損失を考え出します。
最後に、インテント認識マッチングでは、自己監視マスキング タスクによってインテントが評価され、最終的なマッチング結果を出力するために組み込まれます。
要約(オリジナル)
Text matching systems have become a fundamental service in most searching platforms. For instance, they are responsible for matching user queries to relevant candidate items, or rewriting the user-input query to a pre-selected high-performing one for a better search experience. In practice, both the queries and items often contain multiple attributes, such as the category of the item and the location mentioned in the query, which represent condensed key information that is helpful for matching. However, most of the existing works downplay the effectiveness of attributes by integrating them into text representations as supplementary information. Hence, in this work, we focus on exploring the relationship between the attributes from two sides. Since attributes from two ends are often not aligned in terms of number and type, we propose to exploit the benefit of attributes by multiple-intent modeling. The intents extracted from attributes summarize the diverse needs of queries and provide rich content of items, which are more refined and abstract, and can be aligned for paired inputs. Concretely, we propose a multi-intent attribute-aware matching model (MIM), which consists of three main components: attribute-aware encoder, multi-intent modeling, and intent-aware matching. In the attribute-aware encoder, the text and attributes are weighted and processed through a scaled attention mechanism with regard to the attributes’ importance. Afterward, the multi-intent modeling extracts intents from two ends and aligns them. Herein, we come up with a distribution loss to ensure the learned intents are diverse but concentrated, and a kullback-leibler divergence loss that aligns the learned intents. Finally, in the intent-aware matching, the intents are evaluated by a self-supervised masking task, and then incorporated to output the final matching result.
arxiv情報
著者 | Mingzhe Li,Xiuying Chen,Jing Xiang,Qishen Zhang,Changsheng Ma,Chenchen Dai,Jinxiong Chang,Zhongyi Liu,Guannan Zhang |
発行日 | 2024-02-12 16:54:22+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google