要約
Breeze-7B は、Mistral-7B をベースとしたオープンソースの言語モデルであり、繁体字中国語における言語理解力の向上とチャットボット向け機能のニーズに対応するために設計された。本テクニカルレポートでは、Breeze-7B モデルの追加事前学習、微調整、および評価段階の概要を説明します。Breeze-7B ファミリーのベースモデルおよびチャットモデルは、言語理解およびチャットボット指向のタスクにおいて優れた性能を発揮し、同クラスの複雑性を持つモデルの中で、いくつかのベンチマークで上位にランクインしています。
要約(オリジナル)
Breeze-7B is an open-source language model based on Mistral-7B, designed to address the need for improved language comprehension and chatbot-oriented capabilities in Traditional Chinese. This technical report provides an overview of the additional pretraining, finetuning, and evaluation stages for the Breeze-7B model. The Breeze-7B family of base and chat models exhibits good performance on language comprehension and chatbot-oriented tasks, reaching the top in several benchmarks among models comparable in its complexity class.
arxiv情報
| 著者 | Chan-Jan Hsu,Chang-Le Liu,Feng-Ting Liao,Po-Chun Hsu,Yi-Chang Chen,Da-Shan Shiu |
| 発行日 | 2024-04-03 14:29:41+00:00 |
| arxivサイト | arxiv_id(pdf) |