要約
エージェントAIシステムは、複雑なタスクを自律的に実行する能力について大きな注目を集めています。
ただし、適切に準備されたツールへの依存により、医療ドメインでの適用性が制限されているため、特殊なモデルを訓練する必要があります。
この論文では、3つの貢献をしています。(i)医療画像で機械学習(ML)を自動化するために設計された新しいマルチエージェントシステムであるM3Builderを提示します。
M3Builderは、そのコアで、自動化されたデータ処理と環境構成から自己完結型の自動デバッグとモデルトレーニングまで、複雑でマルチステップの医療MLワークフローに取り組むために協力する4つの専門エージェントを採用しています。
これらのエージェントは、医療イメージングMLワークスペース内で動作します。これは、エージェントにデータセット、トレーニングコード、および相互作用ツールのフリーテキスト説明を提供するように設計された構造化された環境で、シームレスな通信とタスクの実行を可能にします。
(ii)自動化された医療イメージングMLの進捗状況を評価するために、5つの解剖学と3つのイメージングモダリティにわたって、14のトレーニングデータセットの4つの一般的なタスクを含むベンチマークであるM3Benchを提案します。
(iii)Claudeシリーズ、GPT-4o、DeepSeek-V3など、システムのエージェントコアとして機能する7つの最先端の大規模言語モデルを実験します。
既存のMLエージェントデザインと比較して、M3Builderは医療イメージングのMLタスクの完了に優れたパフォーマンスを示し、Claude-3.7-Sonnetをエージェントコアとして使用して94.29%の成功率を達成し、医療イメージングにおける完全に自動化された機械学習に向けた大きな可能性を示しています。
要約(オリジナル)
Agentic AI systems have gained significant attention for their ability to autonomously perform complex tasks. However, their reliance on well-prepared tools limits their applicability in the medical domain, which requires to train specialized models. In this paper, we make three contributions: (i) We present M3Builder, a novel multi-agent system designed to automate machine learning (ML) in medical imaging. At its core, M3Builder employs four specialized agents that collaborate to tackle complex, multi-step medical ML workflows, from automated data processing and environment configuration to self-contained auto debugging and model training. These agents operate within a medical imaging ML workspace, a structured environment designed to provide agents with free-text descriptions of datasets, training codes, and interaction tools, enabling seamless communication and task execution. (ii) To evaluate progress in automated medical imaging ML, we propose M3Bench, a benchmark comprising four general tasks on 14 training datasets, across five anatomies and three imaging modalities, covering both 2D and 3D data. (iii) We experiment with seven state-of-the-art large language models serving as agent cores for our system, such as Claude series, GPT-4o, and DeepSeek-V3. Compared to existing ML agentic designs, M3Builder shows superior performance on completing ML tasks in medical imaging, achieving a 94.29% success rate using Claude-3.7-Sonnet as the agent core, showing huge potential towards fully automated machine learning in medical imaging.
arxiv情報
著者 | Jinghao Feng,Qiaoyu Zheng,Chaoyi Wu,Ziheng Zhao,Ya Zhang,Yanfeng Wang,Weidi Xie |
発行日 | 2025-02-27 17:29:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google