The Breeze 2 Herd of Models: Traditional Chinese LLMs Based on Llama with Vision-Aware and Function-Calling Capabilities

要約

llama-breeze2(以下、Breeze2と呼ばれる)は、3Bおよび8Bパラメーター構成で利用可能な高度なマルチモーダル言語モデルのスイートであり、従来の中国語表現を強化するために特別に設計されています。
Llama 3.2モデルファミリーに基づいて、伝統的な中国人の言語的および文化的遺産を強化するために、広範なコーパスでBreeze2の事前訓練を続けています。
言語モデリング機能に加えて、関数呼び出しとビジョン理解機能を備えたモデルを大幅に増強します。
この出版物の時点で、私たちが知っている限り、推論を誘発するプロンプトがない場合、Breeze2は、そのサイズクラスでの従来の中国の機能呼び出しと画像の理解における最も強力なパフォーマンスモデルです。
Beyeze2の有効性は、台湾の一般知識、指導の公開、長いコンテキスト、機能呼び出し、ビジョン理解など、さまざまなタスクにわたってベンチマークされています。
Llama 3.2 Community Licenseの下で、すべてのBreeze2モデルを公開しています。
また、モバイルアプリケーションを使用してモバイルプラットフォームで実行されているモデルの機能を紹介します。

要約(オリジナル)

Llama-Breeze2 (hereinafter referred to as Breeze2) is a suite of advanced multi-modal language models, available in 3B and 8B parameter configurations, specifically designed to enhance Traditional Chinese language representation. Building upon the Llama 3.2 model family, we continue the pre-training of Breeze2 on an extensive corpus to enhance the linguistic and cultural heritage of Traditional Chinese. In addition to language modeling capabilities, we significantly augment the models with function calling and vision understanding capabilities. At the time of this publication, as far as we are aware, absent reasoning-inducing prompts, Breeze2 are the strongest performing models in Traditional Chinese function calling and image understanding in its size class. The effectiveness of Breeze2 is benchmarked across various tasks, including Taiwan general knowledge, instruction-following, long context, function calling, and vision understanding. We are publicly releasing all Breeze2 models under the Llama 3.2 Community License. We also showcase the capabilities of the model running on mobile platform with a mobile application which we also open source.

arxiv情報

著者 MediaTek Research,:,Chan-Jan Hsu,Chia-Sheng Liu,Meng-Hsi Chen,Muxi Chen,Po-Chun Hsu,Yi-Chang Chen,Da-Shan Shiu
発行日 2025-02-11 16:48:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク