CP-Router: An Uncertainty-Aware Router Between LLM and LRM

要約

大規模な推論モデル(LRMS)の最近の進歩により、大規模な言語モデル(LLM)よりも長鎖推論機能が大幅に改善されました。
ただし、LRMSは、単純なクエリでも不必要に長い出力を生成することが多く、LLMSと比較して非効率性または精度の低下につながります。
これを克服するために、LLMとLRMの間で動的に選択するトレーニングフリーでモデルに依存しないルーティングフレームワークであるCPルーターを提案します。
ルーティングの決定は、厳格なカバレッジ保証を提供するコンフォーマル予測(CP)を介して導出された予測不確実性推定値によって導かれます。
入力間の不確実性の差別化をさらに改善するために、適切なCPしきい値を適応的に選択する新しいエントロピーベースの基準である完全およびバイナリエントロピー(FBE)を導入します。
数学、論理的推論、中国の化学を含む多様なMCQAベンチマーク全体の実験は、CPルーターがLRMのみを使用するのと比較して精度を維持または改善しながら、トークンの使用を効率的に削減することを示しています。
また、CPルーターを多様なモデルペアリングとオープンエンドQAに拡張し、その一般性と堅牢性を検証し、強力なパフォーマンスを実証し続けています。

要約(オリジナル)

Recent advances in Large Reasoning Models (LRMs) have significantly improved long-chain reasoning capabilities over Large Language Models (LLMs). However, LRMs often produce unnecessarily lengthy outputs even for simple queries, leading to inefficiencies or even accuracy degradation compared to LLMs. To overcome this, we propose CP-Router, a training-free and model-agnostic routing framework that dynamically selects between an LLM and an LRM, demonstrated with multiple-choice question answering (MCQA) prompts. The routing decision is guided by the prediction uncertainty estimates derived via Conformal Prediction (CP), which provides rigorous coverage guarantees. To further refine the uncertainty differentiation across inputs, we introduce Full and Binary Entropy (FBE), a novel entropy-based criterion that adaptively selects the appropriate CP threshold. Experiments across diverse MCQA benchmarks, including mathematics, logical reasoning, and Chinese chemistry, demonstrate that CP-Router efficiently reduces token usage while maintaining or even improving accuracy compared to using LRM alone. We also extend CP-Router to diverse model pairings and open-ended QA, where it continues to demonstrate strong performance, validating its generality and robustness.

arxiv情報

著者 Jiayuan Su,Fulin Lin,Zhaopeng Feng,Han Zheng,Teng Wang,Zhenyu Xiao,Xinlong Zhao,Zuozhu Liu,Lu Cheng,Hongwei Wang
発行日 2025-05-26 13:33:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク