FAQ-Gen: An automated system to generate domain-specific FAQs to aid content comprehension

要約

よくある質問 (FAQ) は、特定のコンテンツに関する最も一般的な問い合わせを指します。
トピックを簡素化し、情報を簡潔に提示することで理解を促進することで、コンテンツの理解を助けるものとして機能します。
このペーパーでは、テキストからテキストへの変換モデルを活用したエンドツーエンド システムの開発を通じて、明確に定義された自然言語処理 (NLP) タスクとして FAQ の生成に取り組みます。
従来の質問応答システムを対象とした文献レビューを紹介し、FAQ 生成タスクに直接適用した場合の制限を強調します。
私たちは、特定のドメインに合わせたテキストコンテンツから FAQ を構築し、その正確性と関連性を高めることができるシステムを提案します。
私たちは、入力として提供される情報の最適な表現を取得し、人間の理解を最大限に高めるために質問と回答のペアをランク付けするために、自己キュレーションされたアルゴリズムを利用します。
人間による定性的評価では、生成された FAQ が適切に構成されていて読みやすいことを示し、同時にドメイン固有の構成を利用して元のコンテンツ内のドメインベースのニュアンスや専門用語を強調します。

要約(オリジナル)

Frequently Asked Questions (FAQs) refer to the most common inquiries about specific content. They serve as content comprehension aids by simplifying topics and enhancing understanding through succinct presentation of information. In this paper, we address FAQ generation as a well-defined Natural Language Processing (NLP) task through the development of an end-to-end system leveraging text-to-text transformation models. We present a literature review covering traditional question-answering systems, highlighting their limitations when applied directly to the FAQ generation task. We propose our system capable of building FAQs from textual content tailored to specific domains, enhancing their accuracy and relevance. We utilise self-curated algorithms for obtaining optimal representation of information to be provided as input and also for ranking the question-answer pairs to maximise human comprehension. Qualitative human evaluation showcases the generated FAQs to be well-constructed and readable, while also utilising domain-specific constructs to highlight domain-based nuances and jargon in the original content.

arxiv情報

著者 Sahil Kale,Gautam Khaire,Jay Patankar
発行日 2024-02-08 16:49:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク