Retrieval Augmented Generation and Representative Vector Summarization for large unstructured textual data in Medical Education

要約

大規模言語モデルは、コンテンツ生成やチャットボットなどのさまざまなタスクに使用されることが増えています。
LLM は一般的なタスクでは優れたパフォーマンスを発揮しますが、ドメイン固有のタスクに適用する場合は、幻覚や有害な回答の問題を軽減するために連携する必要があります。
検索拡張生成 (RAG) を使用すると、ノンパラメトリック ナレッジベースを LLM に簡単に接続して操作できます。
この論文では、医学教育分野における RAG の応用について説明します。
代表ベクトルを使用した大規模な非構造化テキストデータに対する抽出的要約と抽象的要約を組み合わせた方法が提案されています。

要約(オリジナル)

Large Language Models are increasingly being used for various tasks including content generation and as chatbots. Despite their impressive performances in general tasks, LLMs need to be aligned when applying for domain specific tasks to mitigate the problems of hallucination and producing harmful answers. Retrieval Augmented Generation (RAG) allows to easily attach and manipulate a non-parametric knowledgebases to LLMs. Applications of RAG in the field of medical education are discussed in this paper. A combined extractive and abstractive summarization method for large unstructured textual data using representative vectors is proposed.

arxiv情報

著者 S. S. Manathunga,Y. A. Illangasekara
発行日 2023-08-01 12:04:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, J.3 パーマリンク