A Comparative Study between Full-Parameter and LoRA-based Fine-Tuning on Chinese Instruction Data for Instruction Following Large Language Model

要約

タイトル:Instruction Following Large Language Modelの中国語インストラクションデータにおけるFull-ParameterとLoRAベースのFine-Tuningの比較研究

要約:
– 大規模言語モデルのインストラクション・チューニングは、自然言語処理の重要な研究分野である。
– リソースとコストの制限により、多くの研究者がLoRAなどのパラメータ効率の良いチューニング技術を採用し、良好な結果を得てきた。
– 本研究では、LLaMAをベースモデルとして、Full-Parameter Fine-TuningとLoRAベースのFine-Tuning方法を実験的に比較した。
– 実験結果から、ベースモデルの選択、トレーニングデータセットのスケール、学習可能なパラメータ量、およびモデルトレーニングのコストが重要な要素であることが明らかになった。
– 本論文の実験結果が、特に中国語の大規模言語モデルの訓練において、トレーニングコストとモデルパフォーマンスのトレードオフ戦略を見つけるためのヒントを提供できることを望んでいる。
– 実験結果の再現を容易にするために、データセット、モデル、コードが公開される予定である。

要約(オリジナル)

Recently, the instruction-tuning of large language models is a crucial area of research in the field of natural language processing. Due to resource and cost limitations, several researchers have employed parameter-efficient tuning techniques, such as LoRA, for instruction tuning, and have obtained encouraging results In comparison to full-parameter fine-tuning, LoRA-based tuning demonstrates salient benefits in terms of training costs. In this study, we undertook experimental comparisons between full-parameter fine-tuning and LoRA-based tuning methods, utilizing LLaMA as the base model. The experimental results show that the selection of the foundational model, training dataset scale, learnable parameter quantity, and model training cost are all important factors. We hope that the experimental conclusions of this paper can provide inspiration for training large language models, especially in the field of Chinese, and help researchers find a better trade-off strategy between training cost and model performance. To facilitate the reproduction of the paper’s results, the dataset, model and code will be released.

arxiv情報

著者 Xianghui Sun,Yunjie Ji,Baochang Ma,Xiangang Li
発行日 2023-04-18 03:08:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク