要約
この研究では、英語以外の言語の自動文章評価を容易にするフレームワークであるEASSE-multiを提案します。
オリジナルの EASSE フレームワークと比較して、EASSE-multi は英語のみに焦点を当てていません。
これには、複数の言語に適したトークナイザーとテキスト簡略化評価メトリクスのバージョンが含まれています。
この文書では、ドイツの TS で EASSE-multi を使用し、結果として EASSE-DE が得られる例を示します。
さらに、さまざまな言語またはメトリクスのトークン化設定で評価した場合のテキストの簡略化結果を比較します。
これに基づいて、(ドイツの)TS モデルの評価をより透明性を高め、比較しやすくする方法に関する推奨事項を策定します。
EASSE-multi とそのドイツ語専門化 (EASSE-DE) のコードは、https://github.com/rstodden/easse-de にあります。
要約(オリジナル)
In this work, we propose EASSE-multi, a framework for easier automatic sentence evaluation for languages other than English. Compared to the original EASSE framework, EASSE-multi does not focus only on English. It contains tokenizers and versions of text simplification evaluation metrics which are suitable for multiple languages. In this paper, we exemplify the usage of EASSE-multi for German TS, resulting in EASSE-DE. Further, we compare text simplification results when evaluating with different language or tokenization settings of the metrics. Based on this, we formulate recommendations on how to make the evaluation of (German) TS models more transparent and better comparable. The code of EASSE-multi and its German specialisation (EASSE-DE) can be found at https://github.com/rstodden/easse-de.
arxiv情報
著者 | Regina Stodden |
発行日 | 2024-04-05 08:55:20+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google