Harnessing the Power of Multiple Minds: Lessons Learned from LLM Routing

要約

LLM の急速な発展に伴い、その機能を効率的に活用する方法を問うのは当然のことです。
このペーパーでは、各入力クエリを単一の最適な LLM に送信することが可能かどうかを検討します。
この目的を達成するために、困難な推論タスク用の LLM ルーティングを提案します。
私たちの広範な実験により、このようなルーティングは有望であるものの、すべてのシナリオで実現可能であるわけではないため、このギャップを埋めるためにより堅牢なアプローチを調査する必要があることが示唆されています。

要約(オリジナル)

With the rapid development of LLMs, it is natural to ask how to harness their capabilities efficiently. In this paper, we explore whether it is feasible to direct each input query to a single most suitable LLM. To this end, we propose LLM routing for challenging reasoning tasks. Our extensive experiments suggest that such routing shows promise but is not feasible in all scenarios, so more robust approaches should be investigated to fill this gap.

arxiv情報

著者 KV Aditya Srivatsa,Kaushal Kumar Maurya,Ekaterina Kochmar
発行日 2024-05-01 12:04:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク