Evaluation of semantic relations impact in query expansion-based retrieval systems

要約

さまざまな状況(移動中のユーザーなど)で動作できるインテリジェント システムの需要が高まるにつれ、ユーザーの質問に一貫した回答を提供するには、そのようなシステムによるユーザー ニーズの正確な解釈が重要になってきています。
このようなタスクに対処する最も効果的なアプリケーションは、自然言語処理と用語の意味拡張の分野にあります。
これらの手法は、入力クエリをインテントとして再定式化してその目標を推定することを目的としており、通常、\emph{synonymy}、\emph{antonymy} などのさまざまな意味関係を利用して構築されたテキスト リソースに依存します。
このペーパーの目的は、特定の分類法のラベルを情報源として使用して、そのようなリソースを生成することです。
取得されたリソースは、分類に対する各意味関係の影響を定量化するために、入力クエリのセットを意図として再定式化し、各関係の効果を追跡する単純な分類子に統合されます。
これの拡張として、そのような関係を組み合わせた場合の改善とノイズ導入の間の最良のトレードオフが評価されます。
評価は、リソースとその組み合わせを生成し、ユーザーの質問をラベルとして再定式化するために使用される分類子を調整するためにそれらを使用して行われます。
この評価では、ユースケースとして幅広く多様な分類法を採用し、そのラベルを意味論的拡張の基礎として活用し、疑似クエリの推定を強化する目的でいくつかのコーパスを生成します。

要約(オリジナル)

With the increasing demand of intelligent systems capable of operating in different contexts (e.g. users on the move) the correct interpretation of the user-need by such systems has become crucial to give consistent answers to the user questions. The most effective applications addressing such task are in the fields of natural language processing and semantic expansion of terms. These techniques are aimed at estimating the goal of an input query reformulating it as an intent, commonly relying on textual resources built exploiting different semantic relations like \emph{synonymy}, \emph{antonymy} and many others. The aim of this paper is to generate such resources using the labels of a given taxonomy as source of information. The obtained resources are integrated into a plain classifier for reformulating a set of input queries as intents and tracking the effect of each relation, in order to quantify the impact of each semantic relation on the classification. As an extension to this, the best tradeoff between improvement and noise introduction when combining such relations is evaluated. The assessment is made generating the resources and their combinations and using them for tuning the classifier which is used to reformulate the user questions as labels. The evaluation employs a wide and varied taxonomy as a use-case, exploiting its labels as basis for the semantic expansion and producing several corpora with the purpose of enhancing the pseudo-queries estimation.

arxiv情報

著者 Lorenzo Massai
発行日 2023-12-15 08:44:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク