要約
自己改善エージェントは、監督を最小限に抑えて新しい機能を継続的に取得することを目指しています。
ただし、現在のアプローチは2つの重要な制限に直面しています。自己改善プロセスはしばしば厳格であり、タスクドメイン全体で一般化することができず、エージェント機能の増加に応じて拡大するのに苦労しています。
効果的な自己改善には、独自の学習プロセスを積極的に評価し、反映し、適応させるエージェントの固有の能力として定義される固有のメタ認知学習が必要であると主張します。
人間のメタ認知からインスピレーションを得て、3つのコンポーネントを含む正式なフレームワークを紹介します:メタ認知知識(能力、タスク、学習戦略の自己評価)、メタ認知計画(学習方法と学習方法の決定)、およびメタ認知評価(将来の学習を改善するための学習経験を反映)。
既存の自己改善剤を分析すると、それらは、スケーラビリティと適応性を制限する固定されたヒトが設計したループである外因性メタ認知メカニズムに主に依存していることがわかります。
各コンポーネントを調べると、本質的なメタ認知のための多くの成分がすでに存在していると主張します。
最後に、人間とエージェントの間でメタ認知的責任を最適に配布し、内因性のメタ認知学習を強く評価し、改善する方法を探ります。これは、真に持続、一般化、および整合した自己改善を可能にするために対処する必要がある重要な課題です。
要約(オリジナル)
Self-improving agents aim to continuously acquire new capabilities with minimal supervision. However, current approaches face two key limitations: their self-improvement processes are often rigid, fail to generalize across tasks domains, and struggle to scale with increasing agent capabilities. We argue that effective self-improvement requires intrinsic metacognitive learning, defined as an agent’s intrinsic ability to actively evaluate, reflect on, and adapt its own learning processes. Drawing inspiration from human metacognition, we introduce a formal framework comprising three components: metacognitive knowledge (self-assessment of capabilities, tasks, and learning strategies), metacognitive planning (deciding what and how to learn), and metacognitive evaluation (reflecting on learning experiences to improve future learning). Analyzing existing self-improving agents, we find they rely predominantly on extrinsic metacognitive mechanisms, which are fixed, human-designed loops that limit scalability and adaptability. Examining each component, we contend that many ingredients for intrinsic metacognition are already present. Finally, we explore how to optimally distribute metacognitive responsibilities between humans and agents, and robustly evaluate and improve intrinsic metacognitive learning, key challenges that must be addressed to enable truly sustained, generalized, and aligned self-improvement.
arxiv情報
著者 |
Tennison Liu,Mihaela van der Schaar |
発行日 |
2025-06-05 14:53:35+00:00 |
arxivサイト |
arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google