A Hybrid Strategy for Chat Transcript Summarization

要約

テキストの要約とは、テキストの内容を保持したまま、より少ないセンテンスに凝縮するプロセスです。この文脈におけるチャットトランスクリプトとは、顧客(発信者)とエージェント(複数可)の間のデジタルまたはオンライン会話のテキストコピーのことである。本論文では、まず抽出的要約と抽象的要約の技術を組み合わせ、区切りの悪い、または区切りのないチャットトランスクリプトを圧縮し、より読みやすい区切り付き要約を生成し、強化学習により要約の全体的な品質を最適化する、独自(ローカル)に開発されたハイブリッド手法を紹介する。広範なテスト、評価、比較、検証により、手動で生成された参照(注釈)要約がない場合、チャットトランスクリプト要約の大規模な展開におけるこのアプローチの有効性が実証された。

要約(オリジナル)

Text summarization is the process of condensing a piece of text to fewer sentences, while still preserving its content. Chat transcript, in this context, is a textual copy of a digital or online conversation between a customer (caller) and agent(s). This paper presents an indigenously (locally) developed hybrid method that first combines extractive and abstractive summarization techniques in compressing ill-punctuated or un-punctuated chat transcripts to produce more readable punctuated summaries and then optimizes the overall quality of summarization through reinforcement learning. Extensive testing, evaluations, comparisons, and validation have demonstrated the efficacy of this approach for large-scale deployment of chat transcript summarization, in the absence of manually generated reference (annotated) summaries.

arxiv情報

著者 Pratik K. Biswas
発行日 2024-02-02 15:44:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: 68, cs.CL, I.7 パーマリンク