QueryBuilder: Human-in-the-Loop Query Development for Information Retrieval

要約

多くの場合、情報検索 (IR) システムのユーザーは、包括的な情報ニーズ (別名分析タスク) から始めて、その分析タスクのさまざまな重要な側面 (つまり、サブトピック) をカバーするより詳細なクエリの定義に進みます。
我々は $\textit{QueryBuilder}$ と呼ばれる新しい対話型システムを紹介します。これにより、英語を話す初心者のユーザーでも、英語の開発コーパスを効率的に探索することで、少しの労力でクエリを作成でき、迅速に相互開発を行うことができます。
ユーザーの情報ニーズに対応する言語情報検索クエリ。
QueryBuilder は、ユーザーが入力した検索語に基づいてドキュメントをほぼリアルタイムで取得します。
ユーザーは取得した文書に目を通し、必要な情報に関連する文にマークを付けます。
マークされた文は、クエリの形成と絞り込みにおける追加情報としてシステムによって使用されます。クエリの用語 (およびオプションで、イベント $’トリガー’$ (指標用語) とエージェント/患者の役割を捕捉するイベントの特徴) は適切に重み付けされます。
ニューラルベースのシステムは、テキストの意味をより適切に捕捉し、他の関連コンテンツを取得します。
検索とマーク付けのプロセスは必要なだけ繰り返され、反復のたびにクエリがさらに洗練されます。
最終的な成果物は、言語横断情報検索 (CLIR) で使用されるきめ細かいクエリです。
IARPA BETTER IR データセットからの分析タスクとリクエストを使用した実験では、初心者ユーザーでも、少量の労力 (サブトピックごとに最大 10 分) で、言語を含む $\textit{useful}$ のきめ細かいクエリを作成できることがわかりました。
彼らは理解していません。
QueryBuilder は、従来のコーパス探索およびクエリ形成プロセスに有益な機能も提供します。
デモビデオはhttps://vimeo.com/734795835で公開されています

要約(オリジナル)

Frequently, users of an Information Retrieval (IR) system start with an overarching information need (a.k.a., an analytic task) and proceed to define finer-grained queries covering various important aspects (i.e., sub-topics) of that analytic task. We present a novel, interactive system called $\textit{QueryBuilder}$, which allows a novice, English-speaking user to create queries with a small amount of effort, through efficient exploration of an English development corpus in order to rapidly develop cross-lingual information retrieval queries corresponding to the user’s information needs. QueryBuilder performs near real-time retrieval of documents based on user-entered search terms; the user looks through the retrieved documents and marks sentences as relevant to the information needed. The marked sentences are used by the system as additional information in query formation and refinement: query terms (and, optionally, event features, which capture event $’triggers’$ (indicator terms) and agent/patient roles) are appropriately weighted, and a neural-based system, which better captures textual meaning, retrieves other relevant content. The process of retrieval and marking is repeated as many times as desired, giving rise to increasingly refined queries in each iteration. The final product is a fine-grained query used in Cross-Lingual Information Retrieval (CLIR). Our experiments using analytic tasks and requests from the IARPA BETTER IR datasets show that with a small amount of effort (at most 10 minutes per sub-topic), novice users can form $\textit{useful}$ fine-grained queries including in languages they don’t understand. QueryBuilder also provides beneficial capabilities to the traditional corpus exploration and query formation process. A demonstration video is released at https://vimeo.com/734795835

arxiv情報

著者 Hemanth Kandula,Damianos Karakos,Haoling Qiu,Benjamin Rozonoyer,Ian Soboroff,Lee Tarlin,Bonan Min
発行日 2024-09-10 17:56:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR, cs.LG パーマリンク