From Keywords to Structured Summaries: Streamlining Scholarly Knowledge Access


この短い論文では、科学界における情報検索 (IR) エンジンの重要性の増大に焦点を当て、出版物の量の増加による従来のキーワードベースの検索エンジンの非効率性に対処しています。
提案されたソリューションには、視覚化ダッシュボードなどの高度な情報技術 (IT) ツールを支える構造化された記録が含まれており、従来のテキスト中心のアプローチに代わって、研究者が論文にアクセスしてフィルタリングする方法に革命をもたらします。
このビジョンは、「感染症の再生産数推定」という研究テーマを中心とした概念実証を通じて実証されており、微調整された大規模言語モデル (LLM) を使用して構造化レコードの作成を自動化し、バックエンド データベースにデータを入力します。
その結果、 からアクセスできる次世代の IR メソッドが誕生しました。


This short paper highlights the growing importance of information retrieval (IR) engines in the scientific community, addressing the inefficiency of traditional keyword-based search engines due to the rising volume of publications. The proposed solution involves structured records, underpinning advanced information technology (IT) tools, including visualization dashboards, to revolutionize how researchers access and filter articles, replacing the traditional text-heavy approach. This vision is exemplified through a proof of concept centered on the “reproductive number estimate of infectious diseases” research theme, using a fine-tuned large language model (LLM) to automate the creation of structured records to populate a backend database that now goes beyond keywords. The result is a next-generation IR method accessible at


著者 Mahsa Shamsabadi,Jennifer D’Souza
発行日 2024-02-22 15:10:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CL, cs.DL, cs.IR パーマリンク