要約
複雑な身体的スキルを備えた身体化されたエージェントは、生産性を向上させ、生活の質を高め、人間と機械のコラボレーションを再構築することができます。
私たちは、主に大規模な基礎モデルを含むさまざまなタスクに対して、身体化されたエージェントを自律的に訓練することを目指しています。
これらのモデルは、肉体化されたエージェントの頭脳として機能すると考えられています。
ただし、既存の方法では、タスクの提案とシーンのカスタマイズが人間に大きく依存しており、学習の自律性、トレーニングの効率、学習されたポリシーの一般化が制限されています。
対照的に、人間の関与なしに未知の環境で身体的な学習を促進するために、脳と身体の同期 ({\it BBSEA}) スキームを導入します。
提案されたものは、基礎モデル (「脳」) の知恵と、身体化されたエージェント (「身体」) の物理的能力を組み合わせたものです。
具体的には、「脳」を活用して学習可能な身体的タスクや成功指標を提案し、現場と対話し続けることで「身体」がさまざまなスキルを自動的に習得できるようにする。
私たちは、テーブルトップ設定で提案された自律学習スキームの調査を実行し、提案された同期が多様なタスクを生成し、新しいタスクや構成への適応性が期待できるマルチタスクポリシーを開発できることを実証します。
より複雑なシナリオで大規模な基礎モデルを備えた自律学習エージェントを構築する将来の研究を促進するために、データ、コード、トレーニング済みモデルをリリースします。
さらに多くのビジュアライゼーションは \href{https://bbsea-embodied-ai.github.io}{https://bbsea-embodied-ai.github.io} で利用できます。
要約(オリジナル)
Embodied agents capable of complex physical skills can improve productivity, elevate life quality, and reshape human-machine collaboration. We aim at autonomous training of embodied agents for various tasks involving mainly large foundation models. It is believed that these models could act as a brain for embodied agents; however, existing methods heavily rely on humans for task proposal and scene customization, limiting the learning autonomy, training efficiency, and generalization of the learned policies. In contrast, we introduce a brain-body synchronization ({\it BBSEA}) scheme to promote embodied learning in unknown environments without human involvement. The proposed combines the wisdom of foundation models (“brain”) with the physical capabilities of embodied agents (“body”). Specifically, it leverages the “brain” to propose learnable physical tasks and success metrics, enabling the “body” to automatically acquire various skills by continuously interacting with the scene. We carry out an exploration of the proposed autonomous learning scheme in a table-top setting, and we demonstrate that the proposed synchronization can generate diverse tasks and develop multi-task policies with promising adaptability to new tasks and configurations. We will release our data, code, and trained models to facilitate future studies in building autonomously learning agents with large foundation models in more complex scenarios. More visualizations are available at \href{https://bbsea-embodied-ai.github.io}{https://bbsea-embodied-ai.github.io}
arxiv情報
著者 | Sizhe Yang,Qian Luo,Anumpam Pani,Yanchao Yang |
発行日 | 2024-02-13 04:32:29+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google