要約
現在のテクノロジー環境には、プロセス エンジニアリングの計算を解決するための基礎となる AI モデルが不足しています。
この研究では、検索拡張命令チューニング (RAIT) を活用して、これらの計算のためのオープンでカスタマイズ可能な小規模コード言語モデル (SLM) を強化する新しい自律エージェント フレームワークを導入します。
外部ツールを使用して命令調整コード SLM と検索拡張コード生成 (RACG) を組み合わせることで、エージェントは自然言語仕様に基づいてコードを生成、デバッグ、最適化します。
私たちのアプローチは、特殊なプロセス エンジニアリング タスク用の基礎的な AI モデルが現在欠如しているという限界に対処し、説明可能性、知識の編集、費用対効果の利点を提供します。
さらに、データ不足を克服するために、化学工学およびプロセス工学の問題と解決策のカスタム データセットを厳選しています。
実験結果は、私たちのフレームワークがベンチマーク データセット上の大規模な独自モデルのパフォーマンスに匹敵することを示し、その有効性と使いやすさを証明しています。
要約(オリジナル)
The current technology landscape lacks a foundational AI model for solving process engineering calculations. In this work, we introduce a novel autonomous agent framework leveraging Retrieval-Augmented Instruction-Tuning (RAIT) to enhance open, customizable small code language models (SLMs) for these calculations. By combining instruction tuned code SLMs with Retrieval-Augmented Code Generation (RACG) using external tools, the agent generates, debugs, and optimizes code from natural language specifications. Our approach addresses the limitations of the current lack of a foundational AI model for specialized process engineering tasks and offers benefits of explainability, knowledge editing, and cost-effectiveness. Additionally, we curate custom datasets of chemical and process engineering problems and solutions to overcome data scarcity. Experimental results show that our framework matches the performance of large-scale proprietary models on benchmark datasets, proving its effectiveness and usability.
arxiv情報
著者 | Sagar Srinivas Sakhinana,Geethan Sannidhi,Venkataramana Runkana |
発行日 | 2024-08-28 15:33:47+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google