Science Checker Reloaded: A Bidirectional Paradigm for Transparency and Logical Reasoning

要約

情報検索は急速に進化している分野です。
しかし、科学的および産業上の膨大な量の情報においては、スパース検索における意味の相違と語彙のギャップ、意味検索における低精度と解釈可能性の欠如、または生成モデルにおける幻覚と古い情報など、依然として重大な制限に直面しています。
このペーパーでは、長い文書に関するこれらのハードルに取り組むための 2 つのブロックのアプローチを紹介します。
最初のブロックは、関連するドキュメントを取得するためのクエリ拡張によって、スパース検索における言語の理解を強化します。
2 番目のブロックは、長い文書内に広がる情報のみを使用して、複雑な質問に対して包括的で有益な回答を提供することで結果を深め、双方向のエンゲージメントを可能にします。
パイプラインのさまざまな段階で、システムの推論を理解しやすくするために中間結果がユーザーに表示されます。
私たちは、この双方向のアプローチが、科学情報検索の分野における透明性、論理的思考、包括的な理解の点で大きな進歩をもたらすと信じています。

要約(オリジナル)

Information retrieval is a rapidly evolving field. However it still faces significant limitations in the scientific and industrial vast amounts of information, such as semantic divergence and vocabulary gaps in sparse retrieval, low precision and lack of interpretability in semantic search, or hallucination and outdated information in generative models. In this paper, we introduce a two-block approach to tackle these hurdles for long documents. The first block enhances language understanding in sparse retrieval by query expansion to retrieve relevant documents. The second block deepens the result by providing comprehensive and informative answers to the complex question using only the information spread in the long document, enabling bidirectional engagement. At various stages of the pipeline, intermediate results are presented to users to facilitate understanding of the system’s reasoning. We believe this bidirectional approach brings significant advancements in terms of transparency, logical thinking, and comprehensive understanding in the field of scientific information retrieval.

arxiv情報

著者 Loïc Rakotoson,Sylvain Massip,Fréjus A. A. Laleye
発行日 2024-02-21 16:09:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG, H.3.3 パーマリンク