Breeze-7B Technical Report

要約

Breeze-7B は、Mistral-7B をベースとしたオープンソースの言語モデルであり、繁体字中国語における言語理解力の向上とチャットボット向け機能のニーズに対応するために設計された。本テクニカルレポートでは、Breeze-7B モデルの追加事前学習、微調整、および評価段階の概要を説明します。Breeze-7B ファミリーのベースモデルおよびチャットモデルは、言語理解およびチャットボット指向のタスクにおいて優れた性能を発揮し、同クラスの複雑性を持つモデルの中で、いくつかのベンチマークで上位にランクインしています。

要約(オリジナル)

Breeze-7B is an open-source language model based on Mistral-7B, designed to address the need for improved language comprehension and chatbot-oriented capabilities in Traditional Chinese. This technical report provides an overview of the additional pretraining, finetuning, and evaluation stages for the Breeze-7B model. The Breeze-7B family of base and chat models exhibits good performance on language comprehension and chatbot-oriented tasks, reaching the top in several benchmarks among models comparable in its complexity class.

arxiv情報

著者 Chan-Jan Hsu,Chang-Le Liu,Feng-Ting Liao,Po-Chun Hsu,Yi-Chang Chen,Da-Shan Shiu
発行日 2024-04-03 14:29:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク