FAQ-Gen: An automated system to generate domain-specific FAQs to aid content comprehension

要約

よくある質問 (FAQ) は、特定のコンテンツに関する最も一般的な問い合わせを指します。
トピックを簡素化し、情報を簡潔に提示することで理解を促進することで、コンテンツの理解を助けるものとして機能します。
このペーパーでは、テキストからテキストへの変換モデルを活用したエンドツーエンド システムの開発を通じて、明確に定義された自然言語処理タスクとして FAQ の生成に取り組みます。
従来の質問応答システムを対象とした文献レビューを紹介し、FAQ 生成タスクに直接適用した場合の制限を強調します。
私たちは、特定のドメインに合わせたテキストコンテンツから FAQ を構築し、その精度と関連性を高めることができるシステムを提案します。
当社は、入力として提供される情報の最適な表現を取得し、人間の理解を最大限に高めるために質問と回答のペアをランク付けするために、自己キュレートされたアルゴリズムを利用しています。
人間による定性的評価では、生成された FAQ が適切に構成され読みやすいものであることを示すと同時に、ドメイン固有の構成を利用して元のコンテンツ内のドメインベースのニュアンスや専門用語を強調します。

要約(オリジナル)

Frequently Asked Questions (FAQs) refer to the most common inquiries about specific content. They serve as content comprehension aids by simplifying topics and enhancing understanding through succinct presentation of information. In this paper, we address FAQ generation as a well-defined Natural Language Processing task through the development of an end-to-end system leveraging text-to-text transformation models. We present a literature review covering traditional question-answering systems, highlighting their limitations when applied directly to the FAQ generation task. We propose a system capable of building FAQs from textual content tailored to specific domains, enhancing their accuracy and relevance. We utilise self-curated algorithms to obtain an optimal representation of information to be provided as input and also to rank the question-answer pairs to maximise human comprehension. Qualitative human evaluation showcases the generated FAQs as well-constructed and readable while also utilising domain-specific constructs to highlight domain-based nuances and jargon in the original content.

arxiv情報

著者 Sahil Kale,Gautam Khaire,Jay Patankar
発行日 2024-05-08 17:01:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク