Analytic Task Scheduler: Recursive Least Squares Based Method for Continual Learning in Embodied Foundation Models

要約

具体化された基礎モデルは、固有受容、ビジョン、言語などのマルチモーダル入力を統合して、人間の意図を理解し、ロボットを制御するアクションを生成することにより、人工知能(AI)の物理的世界と相互作用するために重要です。
これらのモデルは、強力な一般化と少数のショット学習能力を示していますが、以前に学んだスキルを忘れずに新しいスキルを継続的に獲得することにおいて、壊滅的な忘却として知られる問題を継続的に獲得することに大きな課題に直面しています。
この問題に対処するために、具体化された基礎モデルで継続的な学習のための新しいフレームワークであるAnalytic Task Scheduler(ATS)を提案します。
ATSはタスク固有のモデルライブラリで構成されており、各モデルは単一のタスクで独立して微調整されており、再帰的最小二乗(RLS)を使用して訓練された分析スケジューラが言語命令とタスク固有のモデルの間のマッピングを学習します。
このアーキテクチャにより、正確なタスク認識と動的モデルの選択が可能になり、タスク全体のパラメーター干渉を根本的に回避できます。
スケジューラは、統計のみ(自己相関と相互相関行列)のみを使用してそのパラメーターを段階的に更新し、履歴データを再訪する必要なく耐性のある学習を可能にします。
現実世界のロボットプラットフォーム(RM65B)でATSを検証し、忘却に対する優れた抵抗とタスクのバリエーションに対する強力な適応性を示しています。
この結果は、ATSが複雑で動的な環境で動作する具体化された基礎モデルで継続的な学習のための効果的でスケーラブルで展開可能なソリューションとして強調しています。
当社のコードは、https://github.com/miaa-embodied-ai/analyticticskschedulerで入手できます

要約(オリジナル)

Embodied foundation models are crucial for Artificial Intelligence (AI) interacting with the physical world by integrating multi-modal inputs, such as proprioception, vision and language, to understand human intentions and generate actions to control robots. While these models demonstrate strong generalization and few-shot learning capabilities, they face significant challenges in continually acquiring new skills without forgetting previously learned skills, a problem known as catastrophic forgetting. To address this issue, we propose the Analytic Task Scheduler (ATS), a novel framework for continual learning in embodied foundation models. ATS consists of a task-specific model library, where each model is fine-tuned independently on a single task, and an analytic scheduler trained using recursive least squares (RLS) to learn the mapping between language instructions and task-specific models. This architecture enables accurate task recognition and dynamic model selection while fundamentally avoiding parameter interference across tasks. The scheduler updates its parameters incrementally using only statistics (autocorrelation and cross-correlation matrices), enabling forgetting-resistant learning without the need to revisit historical data. We validate ATS on a real-world robot platform (RM65B), demonstrating superior resistance to forgetting and strong adaptability to task variations. The results highlight ATS as an effective, scalable, and deployable solution for continual learning in embodied foundation models operating in complex, dynamic environments. Our code will be available at https://github.com/MIAA-Embodied-AI/AnalyticTaskScheduler

arxiv情報

著者 Lipei Xie,Yingxin Li,Huiping Zhuang
発行日 2025-06-11 11:28:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク