YORC: Yoruba Reading Comprehension dataset

要約

この論文では、ヨルバ語の高校読解試験に基づいた新しい多肢選択ヨルバ語読解データセットである YORC を作成します。
事前トレーニングされたエンコーダーのみのモデルに基づいて、既存の英語 RACE データセットを使用して言語間転送を実行することにより、ベースライン結果を提供します。
さらに、GPT-4 などの大規模言語モデル (LLM) をプロンプトすることによって結果を提供します。

要約(オリジナル)

In this paper, we create YORC: a new multi-choice Yoruba Reading Comprehension dataset that is based on Yoruba high-school reading comprehension examination. We provide baseline results by performing cross-lingual transfer using existing English RACE dataset based on a pre-trained encoder-only model. Additionally, we provide results by prompting large language models (LLMs) like GPT-4.

arxiv情報

著者 Anuoluwapo Aremu,Jesujoba O. Alabi,David Ifeoluwa Adelani
発行日 2023-09-14 07:31:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク