Harnessing the Reasoning Economy: A Survey of Efficient Reasoning for Large Language Models

要約

大規模な言語モデル(LLMS)の最近の進歩により、複雑な推論タスクを実行する能力が大幅に向上し、高速かつ直感的な思考(システム1)から遅くて深い推論(システム2)に移行しています。
システム2の推論はタスクの精度を向上させますが、そのゆっくりと思考の性質と非効率的または不必要な推論行動により、多くの場合、かなりの計算コストが発生します。
対照的に、システム1の推論は計算上効率的ですが、最適ではないパフォーマンスにつながります。
その結果、パフォーマンス(利益)と計算コスト(予算)のトレードオフのバランスをとることが重要です。これは、推論経済の概念を生み出します。
この調査では、LLMのトレーニング後およびテスト時間の推論段階の両方で、推論経済の包括的な分析を提供し、i)推論の非効率性、ii)異なる推論パターンの行動分析、およびiii)推論経済を達成するための潜在的なソリューションを提供します。
実用的な洞察を提供し、オープンな課題を強調することにより、LLMSの推論経済を改善するための戦略に光を当てることを目指しており、それにより、この進化する分野で研究を進めるための貴重なリソースとして機能します。
また、この急速に進化する分野の開発を継続的に追跡するための公開リポジトリも提供しています。

要約(オリジナル)

Recent advancements in Large Language Models (LLMs) have significantly enhanced their ability to perform complex reasoning tasks, transitioning from fast and intuitive thinking (System 1) to slow and deep reasoning (System 2). While System 2 reasoning improves task accuracy, it often incurs substantial computational costs due to its slow thinking nature and inefficient or unnecessary reasoning behaviors. In contrast, System 1 reasoning is computationally efficient but leads to suboptimal performance. Consequently, it is critical to balance the trade-off between performance (benefits) and computational costs (budgets), giving rise to the concept of reasoning economy. In this survey, we provide a comprehensive analysis of reasoning economy in both the post-training and test-time inference stages of LLMs, encompassing i) the cause of reasoning inefficiency, ii) behavior analysis of different reasoning patterns, and iii) potential solutions to achieve reasoning economy. By offering actionable insights and highlighting open challenges, we aim to shed light on strategies for improving the reasoning economy of LLMs, thereby serving as a valuable resource for advancing research in this evolving area. We also provide a public repository to continually track developments in this fast-evolving field.

arxiv情報

著者 Rui Wang,Hongru Wang,Boyang Xue,Jianhui Pang,Shudong Liu,Yi Chen,Jiahao Qiu,Derek Fai Wong,Heng Ji,Kam-Fai Wong
発行日 2025-03-31 17:58:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク