Spivavtor: An Instruction Tuned Ukrainian Text Editing Model

要約

Spivavtor、データセット、およびウクライナ語に焦点を当てたテキスト編集用の命令調整モデルを紹介します。
Spivavtor は、英語のみの CoEdIT モデルをウクライナに焦点を当てて適応させたものです。
CoEdIT と同様に、Spivavtor はウクライナ語の指示に従ってテキスト編集タスクを実行します。
このペーパーでは、Spivavtor-Instruct データセットと Spivavtor モデルの詳細について説明します。
私たちは、文法的誤り訂正 (GEC)、テキストの簡略化、一貫性、言い換えなど、ウクライナ語のさまざまなテキスト編集タスクで Spivavtor を評価し、そのすべてにおいて優れたパフォーマンスを示しています。
私たちは、この分野でさらなる研究を進めるために、最高のパフォーマンスを発揮するモデルとデータをリソースとしてコミュニティに公開します。

要約(オリジナル)

We introduce Spivavtor, a dataset, and instruction-tuned models for text editing focused on the Ukrainian language. Spivavtor is the Ukrainian-focused adaptation of the English-only CoEdIT model. Similar to CoEdIT, Spivavtor performs text editing tasks by following instructions in Ukrainian. This paper describes the details of the Spivavtor-Instruct dataset and Spivavtor models. We evaluate Spivavtor on a variety of text editing tasks in Ukrainian, such as Grammatical Error Correction (GEC), Text Simplification, Coherence, and Paraphrasing, and demonstrate its superior performance on all of them. We publicly release our best-performing models and data as resources to the community to advance further research in this space.

arxiv情報

著者 Aman Saini,Artem Chernodub,Vipul Raheja,Vivek Kulkarni
発行日 2024-04-29 17:16:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク