Abstraction-of-Thought Makes Language Models Better Reasoners

要約

抽象的推論、つまり問題の抽象的な本質から推論する能力は、人間の推論を一般化するための鍵として機能します。
ただし、抽象化による推論を実行するための言語モデルを導き出すことは未開発のままです。
この論文は、Abstraction-of-Thought (AoT) と呼ばれる新しい構造化推論形式を導入することで、このギャップを埋めることを目指しています。
AoT の独自性は、推論プロセス内のさまざまなレベルの抽象化に対する明示的な要件にあります。
このアプローチにより、言語モデルは、具体的な詳細を組み込む前に、まず抽象レベルで熟考するようになる可能性がありますが、これは、一般的なステップバイステップの思考連鎖 (CoT) 手法では見落とされています。
モデルを AoT 形式に合わせるために、自動化されたスケーラブルなパイプラインを介して収集された、AoT 推論プロセスを備えた 348,000 の高品質サンプルで構成される汎用微調整データセットである AoT Collection を紹介します。
AoT Collection を使用して幅広い言語モデルを微調整し、挑戦的なベンチマークである Big-Bench Hard からの 23 の目に見えないタスクについて広範な評価を実施します。
実験結果は、AoT 推論形式に合わせたモデルが、多くの推論タスクにおいて CoT に合わせたモデルよりも大幅に優れていることを示しています。

要約(オリジナル)

Abstract reasoning, the ability to reason from the abstract essence of a problem, serves as a key to generalization in human reasoning. However, eliciting language models to perform reasoning with abstraction remains unexplored. This paper seeks to bridge this gap by introducing a novel structured reasoning format called Abstraction-of-Thought (AoT). The uniqueness of AoT lies in its explicit requirement for varying levels of abstraction within the reasoning process. This approach could elicit language models to first contemplate on the abstract level before incorporating concrete details, which is overlooked by the prevailing step-by-step Chain-of-Thought (CoT) method. To align models with the AoT format, we present AoT Collection, a generic finetuning dataset consisting of 348k high-quality samples with AoT reasoning processes, collected via an automated and scalable pipeline. We finetune a wide range of language models with AoT Collection and conduct extensive evaluations on 23 unseen tasks from the challenging benchmark Big-Bench Hard. Experimental results indicate that models aligned to AoT reasoning format substantially outperform those aligned to CoT in many reasoning tasks.

arxiv情報

著者 Ruixin Hong,Hongming Zhang,Xiaoman Pan,Dong Yu,Changshui Zhang
発行日 2024-09-26 11:15:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク