要約
現代の人工知能の基礎である機械学習は、世界を根本的に変えた革新を推進してきました。
しかし、進歩の背後には、労働と集中的な反復と実験を計算する必要がある複雑でしばしば退屈なプロセスがあります。
機械学習モデルを開発するエンジニアと科学者は、革新的なソリューションや研究仮説を概念化する代わりに、試行錯誤のタスクに多くの時間を費やしています。
この課題に対処するために、大規模な言語モデル(LLMS)を搭載した機械学習エンジニアリングエージェントであるAI駆動型探査(AIDE)を紹介します。
AIDEフレーム機械学習エンジニアリングは、コードの最適化問題としてエンジニアリングを行い、潜在的なソリューションの空間でツリー検索として試行錯誤を策定します。
有望なソリューションを戦略的に再利用および改良することにより、Aideは計算リソースを効果的に交換してパフォーマンスを向上させ、Kaggle評価、Openai Mle-Bench、Metrs Re-Benchなど、複数の機械学習エンジニアリングベンチマークで最先端の結果を達成します。
要約(オリジナル)
Machine learning, the foundation of modern artificial intelligence, has driven innovations that have fundamentally transformed the world. Yet, behind advancements lies a complex and often tedious process requiring labor and compute intensive iteration and experimentation. Engineers and scientists developing machine learning models spend much of their time on trial-and-error tasks instead of conceptualizing innovative solutions or research hypotheses. To address this challenge, we introduce AI-Driven Exploration (AIDE), a machine learning engineering agent powered by large language models (LLMs). AIDE frames machine learning engineering as a code optimization problem, and formulates trial-and-error as a tree search in the space of potential solutions. By strategically reusing and refining promising solutions, AIDE effectively trades computational resources for enhanced performance, achieving state-of-the-art results on multiple machine learning engineering benchmarks, including our Kaggle evaluations, OpenAI MLE-Bench and METRs RE-Bench.
arxiv情報
著者 | Zhengyao Jiang,Dominik Schmidt,Dhruv Srikanth,Dixing Xu,Ian Kaplan,Deniss Jacenko,Yuxiang Wu |
発行日 | 2025-02-18 18:57:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google