要約
人間レベルの知性を達成するには、高速で直感的なシステム1からより遅く、より意図的なシステム2の推論への移行を改善する必要があります。
システム1は迅速でヒューリスティックな決定に優れていますが、システム2は、より正確な判断とバイアスの減少のために論理的推論に依存しています。
基本的な大規模な言語モデル(LLM)は、迅速な意思決定に優れていますが、真のシステム2思考の特徴的な段階的な分析をまだ完全に受け入れていないため、複雑な推論の深さがありません。
最近、OpenaiのO1/O3やDeepseekのR1などのLLMSは、数学やコーディングなどの分野での専門家レベルのパフォーマンスを実証し、システム2の意図的な推論を密接に模倣し、人間のような認知能力を示しています。
この調査は、基礎LMSの進捗状況とSystem 2 Technologiesの早期開発の簡単な概要から始まり、LLMSの推論の方法を組み合わせた方法を探ります。
次に、推論LLMSを構築し、機能の分析方法、高度な推論を可能にするコア方法、およびさまざまな推論LLMの進化について説明します。
さらに、Reasoning Benchmarksの概要を提供し、代表的なReasoning LLMSのパフォーマンスの詳細な比較を提供します。
最後に、LLMSを推論するための有望な方向性を探り、リアルタイム\ href {https://github.com/zzli2022/awesome-slow-rason-system} {githubリポジトリ} {githubリポジトリ}を追跡します。
この調査が、この急速に進化する分野での革新を促し、進歩を促進するための貴重なリソースとして役立つことを願っています。
要約(オリジナル)
Achieving human-level intelligence requires refining the transition from the fast, intuitive System 1 to the slower, more deliberate System 2 reasoning. While System 1 excels in quick, heuristic decisions, System 2 relies on logical reasoning for more accurate judgments and reduced biases. Foundational Large Language Models (LLMs) excel at fast decision-making but lack the depth for complex reasoning, as they have not yet fully embraced the step-by-step analysis characteristic of true System 2 thinking. Recently, reasoning LLMs like OpenAI’s o1/o3 and DeepSeek’s R1 have demonstrated expert-level performance in fields such as mathematics and coding, closely mimicking the deliberate reasoning of System 2 and showcasing human-like cognitive abilities. This survey begins with a brief overview of the progress in foundational LLMs and the early development of System 2 technologies, exploring how their combination has paved the way for reasoning LLMs. Next, we discuss how to construct reasoning LLMs, analyzing their features, the core methods enabling advanced reasoning, and the evolution of various reasoning LLMs. Additionally, we provide an overview of reasoning benchmarks, offering an in-depth comparison of the performance of representative reasoning LLMs. Finally, we explore promising directions for advancing reasoning LLMs and maintain a real-time \href{https://github.com/zzli2022/Awesome-Slow-Reason-System}{GitHub Repository} to track the latest developments. We hope this survey will serve as a valuable resource to inspire innovation and drive progress in this rapidly evolving field.
arxiv情報
著者 | Zhong-Zhi Li,Duzhen Zhang,Ming-Liang Zhang,Jiaxin Zhang,Zengyan Liu,Yuxuan Yao,Haotian Xu,Junhao Zheng,Pei-Jie Wang,Xiuyi Chen,Yingying Zhang,Fei Yin,Jiahua Dong,Zhijiang Guo,Le Song,Cheng-Lin Liu |
発行日 | 2025-02-24 18:50:52+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google