Adapt On-the-Go: Behavior Modulation for Single-Life Robot Deployment

要約

現実世界で成功するには、ロボットは訓練中に見られたものとは異なる状況に対処する必要があります。
私たちは、以前に学習した動作の多様なレパートリーを利用して、展開中にそのような新しいシナリオにリアルタイムで適応する問題を研究します。
私たちのアプローチである RObust Autonomous Modulation (ROAM) は、事前トレーニングされた動作の認識された価値に基づいて、事前トレーニングされた動作を選択し、目の前の状況に適応させるメカニズムを導入します。
重要なのは、この適応プロセスはすべて、人間の監督なしで、テスト時に 1 つのエピソード内で行われることです。
私たちは選択メカニズムの理論的分析を提供し、ROAM によりロボットがシミュレーションと実際の G​​o1 四足歩行の両方でダイナミクスの変化に迅速に適応し、足にローラー スケートを履いても正常に前進できることを実証しました。
当社のアプローチは、関連する動作をオンザフライで効果的に選択して適応させることで、展開中にさまざまな配布外の状況に直面した場合に、既存の方法と比較して 2 倍以上効率的に適応します。

要約(オリジナル)

To succeed in the real world, robots must cope with situations that differ from those seen during training. We study the problem of adapting on-the-fly to such novel scenarios during deployment, by drawing upon a diverse repertoire of previously learned behaviors. Our approach, RObust Autonomous Modulation (ROAM), introduces a mechanism based on the perceived value of pre-trained behaviors to select and adapt pre-trained behaviors to the situation at hand. Crucially, this adaptation process all happens within a single episode at test time, without any human supervision. We provide theoretical analysis of our selection mechanism and demonstrate that ROAM enables a robot to adapt rapidly to changes in dynamics both in simulation and on a real Go1 quadruped, even successfully moving forward with roller skates on its feet. Our approach adapts over 2x as efficiently compared to existing methods when facing a variety of out-of-distribution situations during deployment by effectively choosing and adapting relevant behaviors on-the-fly.

arxiv情報

著者 Annie S. Chen,Govind Chada,Laura Smith,Archit Sharma,Zipeng Fu,Sergey Levine,Chelsea Finn
発行日 2023-11-02 08:22:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク