Learning to Adapt the Parameters of Behavior Trees and Motion Generators to Task Variations

要約

新しいタスクを学習し、さまざまなバリエーションや次元にすばやく適応する能力は、アジャイル ロボティクスの重要な属性です。
以前の作業では、アセンブリ タスクの学習と実行を容易にするロボット アームのポリシー表現として、ビヘイビア ツリーとモーション ジェネレーター (BTMG) を調査しました。
特定のタスクに対する BTMG の現在の実装は、環境の変化に対して堅牢ではない可能性があり、タスクのさまざまなバリエーションに対してうまく一般化できない可能性があります。
新しいタスク バリエーションの BTMG パラメータを予測するモジュールを使用して BTMG ポリシー表現を拡張することを提案します。
これを実現するために、ガウス過程と重み付きサポート ベクター マシン分類器を組み合わせたモデルを提案します。
このモデルは、BTMG パラメーターとタスクのバリエーションを入力として、予測されたポリシーのパフォーマンス指標と実現可能性を予測します。
モデルの出力を使用して、オプティマイザ内で使用される代理報酬関数を構築し、固定タスク バリエーションの BTMG パラメータでタスクのパフォーマンスを最大化します。
提案したアプローチの有効性を実証するために、シミュレーションと実際の KUKA iiwa ロボットを使用して、プッシュと障害物回避タスクの実験的評価を行いました。
さらに、アプローチのパフォーマンスを 4 つのベースライン手法と比較しました。

要約(オリジナル)

The ability to learn new tasks and quickly adapt to different variations or dimensions is an important attribute in agile robotics. In our previous work, we have explored Behavior Trees and Motion Generators (BTMGs) as a robot arm policy representation to facilitate the learning and execution of assembly tasks. The current implementation of the BTMGs for a specific task may not be robust to the changes in the environment and may not generalize well to different variations of tasks. We propose to extend the BTMG policy representation with a module that predicts BTMG parameters for a new task variation. To achieve this, we propose a model that combines a Gaussian process and a weighted support vector machine classifier. This model predicts the performance measure and the feasibility of the predicted policy with BTMG parameters and task variations as inputs. Using the outputs of the model, we then construct a surrogate reward function that is utilized within an optimizer to maximize the performance of a task over BTMG parameters for a fixed task variation. To demonstrate the effectiveness of our proposed approach, we conducted experimental evaluations on push and obstacle avoidance tasks in simulation and with a real KUKA iiwa robot. Furthermore, we compared the performance of our approach with four baseline methods.

arxiv情報

著者 Faseeh Ahmad,Matthias Mayr,Volker Krueger
発行日 2023-03-14 19:58:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク