要約
大規模言語モデル (LLM) を下流のタスクに適応させるには、効率的な微調整が不可欠です。
ただし、これらのメソッドをさまざまなモデルに実装するには、並大抵の努力が必要です。
私たちは、一連の最先端の効率的なトレーニング方法を統合する統合フレームワークである LlamaFactory を紹介します。
これにより、ユーザーは組み込みの Web UI LlamaBoard を使用して、コーディングを必要とせずに 100 以上の LLM の微調整を柔軟にカスタマイズできます。
私たちは、言語モデリングとテキスト生成タスクに関するフレームワークの効率と有効性を経験的に検証します。
https://github.com/hiyouga/LLaMA-Factory でリリースされており、すでに 13,000 個以上のスターと 1,600 個以上のフォークを獲得しています。
要約(オリジナル)
Efficient fine-tuning is vital for adapting large language models (LLMs) to downstream tasks. However, it requires non-trivial efforts to implement these methods on different models. We present LlamaFactory, a unified framework that integrates a suite of cutting-edge efficient training methods. It allows users to flexibly customize the fine-tuning of 100+ LLMs without the need for coding through the built-in web UI LlamaBoard. We empirically validate the efficiency and effectiveness of our framework on language modeling and text generation tasks. It has been released at https://github.com/hiyouga/LLaMA-Factory and already received over 13,000 stars and 1,600 forks.
arxiv情報
著者 | Yaowei Zheng,Richong Zhang,Junhao Zhang,Yanhan Ye,Zheyan Luo |
発行日 | 2024-03-20 08:08:54+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google