OptimAI: Optimization from Natural Language Using LLM-Powered AI Agents

要約

最適化は科学研究と実用的なアプリケーションで重要な役割を果たしますが、自然言語で説明されている具体的な最適化問題を数学的形式に策定し、問題を解決するための適切なソルバーを選択するには、かなりのドメインの専門知識が必要です。
\ underline {optime} izationの問題を解くためのフレームワークである\ textbf {optimai}を紹介します。LLMを搭載した\ underline {ai}エージェントを活用して、現在の最先端の方法よりも優れたパフォーマンスを達成します。
私たちのフレームワークは、4つの重要な役割に基づいて構築されています。(1)自然言語の問題の説明を正確な数学の定式化に変換するa ​​\ emph {formulator}。
(2)実行前に高レベルのソリューション戦略を構築するA \ emph {planner}。
(3)A \ empond {Coder}と\ empond {code批評家}は、環境と対話し、結果を反映して将来の行動を改善することができます。
アブレーション研究は、すべての役割が不可欠であることを確認しています。
プランナーまたはコード評論家を削除すると、それぞれ5.8ドルのタイム$と$ 3.1 \ Times $の生産性が低下します。
さらに、UCBベースのデバッグスケジューリングを導入して、代替プランを動的に切り替えて、追加の$ 3.3 \ Times $の生産性の向上をもたらします。
私たちのデザインは、マルチエージェントのコラボレーションを強調し、統一されたシステム内で多様なモデルを組み合わせることの相乗効果を便利に探求することができます。
私たちのアプローチは、NLP4LPデータセットで88.1 \%の精度を達成し、Optibench(非線形W/Oテーブル)サブセットで71.2 \%を達成し、以前の最良の結果でそれぞれエラー率を58 \%および50 \%削減します。

要約(オリジナル)

Optimization plays a vital role in scientific research and practical applications, but formulating a concrete optimization problem described in natural language into a mathematical form and selecting a suitable solver to solve the problem requires substantial domain expertise. We introduce \textbf{OptimAI}, a framework for solving \underline{Optim}ization problems described in natural language by leveraging LLM-powered \underline{AI} agents, achieving superior performance over current state-of-the-art methods. Our framework is built upon four key roles: (1) a \emph{formulator} that translates natural language problem descriptions into precise mathematical formulations; (2) a \emph{planner} that constructs a high-level solution strategy prior to execution; and (3) a \emph{coder} and a \emph{code critic} capable of interacting with the environment and reflecting on outcomes to refine future actions. Ablation studies confirm that all roles are essential; removing the planner or code critic results in $5.8\times$ and $3.1\times$ drops in productivity, respectively. Furthermore, we introduce UCB-based debug scheduling to dynamically switch between alternative plans, yielding an additional $3.3\times$ productivity gain. Our design emphasizes multi-agent collaboration, allowing us to conveniently explore the synergistic effect of combining diverse models within a unified system. Our approach attains 88.1\% accuracy on the NLP4LP dataset and 71.2\% on the Optibench (non-linear w/o table) subset, reducing error rates by 58\% and 50\% respectively over prior best results.

arxiv情報

著者 Raghav Thind,Youran Sun,Ling Liang,Haizhao Yang
発行日 2025-04-23 17:45:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク