Learning to Adapt the Parameters of Behavior Trees and Motion Generators (BTMGs) to Task Variations

要約

新しいタスクを学習し、さまざまなバリエーションや次元に迅速に適応する能力は、アジャイル ロボット工学における重要な特性です。
以前の研究では、アセンブリ タスクの学習と実行を容易にするロボット アームのポリシー表現として、ビヘイビア ツリーとモーション ジェネレーター (BTMG) を検討しました。
特定のタスクに対する BTMG の現在の実装は、環境の変化に対して堅牢ではない可能性があり、タスクのさまざまなバリエーションにうまく一般化できない可能性があります。
新しいタスクバリエーションの BTMG パラメーターを予測するモジュールを使用して BTMG ポリシー表現を拡張することを提案します。
これを達成するために、ガウス プロセスと重み付きサポート ベクター マシン分類器を組み合わせたモデルを提案します。
このモデルは、BTMG パラメーターとタスクの変動を入力として使用して、パフォーマンスの尺度と、予測されたポリシーの実現可能性を予測します。
次に、モデルの出力を使用して、オプティマイザー内で利用される代理報酬関数を構築し、固定タスクのバリエーションの BTMG パラメーターに対するタスクのパフォーマンスを最大化します。
私たちが提案したアプローチの有効性を実証するために、シミュレーションと実際のKUKA iiwaロボットを使用して、押すタスクと障害物を回避するタスクの実験的評価を実施しました。
さらに、私たちのアプローチのパフォーマンスを 4 つのベースライン手法と比較しました。

要約(オリジナル)

The ability to learn new tasks and quickly adapt to different variations or dimensions is an important attribute in agile robotics. In our previous work, we have explored Behavior Trees and Motion Generators (BTMGs) as a robot arm policy representation to facilitate the learning and execution of assembly tasks. The current implementation of the BTMGs for a specific task may not be robust to the changes in the environment and may not generalize well to different variations of tasks. We propose to extend the BTMG policy representation with a module that predicts BTMG parameters for a new task variation. To achieve this, we propose a model that combines a Gaussian process and a weighted support vector machine classifier. This model predicts the performance measure and the feasibility of the predicted policy with BTMG parameters and task variations as inputs. Using the outputs of the model, we then construct a surrogate reward function that is utilized within an optimizer to maximize the performance of a task over BTMG parameters for a fixed task variation. To demonstrate the effectiveness of our proposed approach, we conducted experimental evaluations on push and obstacle avoidance tasks in simulation and with a real KUKA iiwa robot. Furthermore, we compared the performance of our approach with four baseline methods.

arxiv情報

著者 Faseeh Ahmad,Matthias Mayr,Volker Krueger
発行日 2023-09-14 11:07:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク