Exploring the Effectiveness of Methods for Persona Extraction


このタスク用にモデルをトレーニングするために、マルチセッション チャット データセットが複数の翻訳モデルを使用してロシア語に翻訳され、その結果データ品質が向上しました。
抽出モデルの有効性を評価するために、F スコアの概念に基づく指標が提示されます。
実験は、MBart、FRED-T5、Mistral モデルに基づく Starling-7B、および Encoder2Encoder モデルで実施されました。
NCE 損失を組み込むことで、リコールを犠牲にしてモデルの精度が向上しました。


The paper presents a study of methods for extracting information about dialogue participants and evaluating their performance in Russian. To train models for this task, the Multi-Session Chat dataset was translated into Russian using multiple translation models, resulting in improved data quality. A metric based on the F-score concept is presented to evaluate the effectiveness of the extraction models. The metric uses a trained classifier to identify the dialogue participant to whom the persona belongs. Experiments were conducted on MBart, FRED-T5, Starling-7B, which is based on the Mistral, and Encoder2Encoder models. The results demonstrated that all models exhibited an insufficient level of recall in the persona extraction task. The incorporation of the NCE Loss improved the model’s precision at the expense of its recall. Furthermore, increasing the model’s size led to enhanced extraction of personas.


著者 Konstantin Zaitsev
発行日 2024-07-12 11:30:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク