Weak-to-Strong Reasoning


大規模言語モデル (LLM) が人間レベルの能力を超えると、これらのモデルに対して本格的かつ正確な監視を提供することがますます困難になります。
このペーパーでは、より高度なモデルや人間が注釈を付けたデータからの入力を必要とせずに、強力なモデルが自律的にトレーニング データを改良できるようにする漸進的学習フレームワークを紹介します。
GSM8K および MATH データセットに関する広範な実験により、私たちの方法が 3 つの別々の弱いモデルを使用して Llama2-70b の推論能力を大幅に強化することが実証されました。
この研究により、AI の推論能力を強化するための、よりスケーラブルで洗練された戦略への道が開かれます。
関連するコードとリソースはすべて \url{https://github.com/GAIR-NLP/weak-to-strong-reasoning} で入手できます。


When large language models (LLMs) exceed human-level capabilities, it becomes increasingly challenging to provide full-scale and accurate supervisions for these models. Weak-to-strong learning, which leverages a less capable model to unlock the latent abilities of a stronger model, proves valuable in this context. Yet, the efficacy of this approach for complex reasoning tasks is still untested. Furthermore, tackling reasoning tasks under the weak-to-strong setting currently lacks efficient methods to avoid blindly imitating the weak supervisor including its errors. In this paper, we introduce a progressive learning framework that enables the strong model to autonomously refine its training data, without requiring input from either a more advanced model or human-annotated data. This framework begins with supervised fine-tuning on a selective small but high-quality dataset, followed by preference optimization on contrastive samples identified by the strong model itself. Extensive experiments on the GSM8K and MATH datasets demonstrate that our method significantly enhances the reasoning capabilities of Llama2-70b using three separate weak models. This method is further validated in a forward-looking experimental setup, where Llama3-8b-instruct effectively supervises Llama3-70b on the highly challenging OlympicArena dataset. This work paves the way for a more scalable and sophisticated strategy to enhance AI reasoning powers. All relevant code and resources are available in \url{https://github.com/GAIR-NLP/weak-to-strong-reasoning}.


著者 Yuqing Yang,Yan Ma,Pengfei Liu
発行日 2024-07-18 16:25:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク