要約
この文書では、最初で最大のオープンソースのイタリア語会話大規模言語モデル (LLM) である Fauno について説明します。
Fauno での私たちの目標は、イタリア語での LLM の研究を民主化し、単一の GPU で微調整された会話ボットの取得が可能であることを実証することです。
さらに、イタリア語の会話型 AI のデータセットのコレクションをリリースします。
Fauno を微調整したデータセットには、一般的な質問応答、コンピューター サイエンス、医療に関する質問など、さまざまなトピックが含まれています。
コードとデータセットは \url{https://github.com/RSTLess-research/Fauno-Italian-LLM} でリリースしています。
要約(オリジナル)
This paper presents Fauno, the first and largest open-source Italian conversational Large Language Model (LLM). Our goal with Fauno is to democratize the study of LLMs in Italian, demonstrating that obtaining a fine-tuned conversational bot with a single GPU is possible. In addition, we release a collection of datasets for conversational AI in Italian. The datasets on which we fine-tuned Fauno include various topics such as general question answering, computer science, and medical questions. We release our code and datasets on \url{https://github.com/RSTLess-research/Fauno-Italian-LLM}
arxiv情報
著者 | Andrea Bacciu,Giovanni Trappolini,Andrea Santilli,Emanuele Rodolà,Fabrizio Silvestri |
発行日 | 2023-06-26 07:00:38+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google