Adaptive Manipulation using Behavior Trees

要約

多くの操作タスクでは、バルブを締めたり緩めたりするためのひねり動作など、一連の一般的な動作のインスタンスが使用されます。
ただし、同じ動作の異なるインスタンスでは、異なる環境パラメータ (力/トルク レベルなど) が必要になることが多く、したがって正常に完了するには異なる操作戦略が必要になります。
たとえば、バルブハンドルを正面からではなく横から握ると、加えられるトルクが増加します。
人間はそのような問題に最も適した操作戦略を直観的に適応させることができますが、そのような動作をロボットに表現して実装することは未解決の問題のままです。
我々は、適応操作のためのビヘイビアツリーベースのアプローチを提案します。このアプローチでは、ロボットはタスクの実行中に操作戦略の離散的なセットから反応的に選択し、切り替えることができます。
さらに、私たちのアプローチにより、ロボットはパフォーマンスを最適化するための過去の試みから学習することができ、たとえば、さまざまなタスクインスタンスに対する最適な戦略を学習することができます。
私たちのアプローチでは、ロボットがタスクの失敗を先取りして、より実現可能な戦略に変更するか、致命的な失敗が発生する前に安全にタスクを終了することもできます。
我々は、一般的な適応ロボット動作のための単純な動作ツリー設計を提案し、それを産業操作のコンテキストに適用します。
適応動作は、単一の操作戦略のみを使用したすべてのベースライン動作を上回り、サンプル タスクを完了するためにかかる試行回数と全体の時間が大幅に減少しました。
私たちの結果は、タスク完了における堅牢性と効率が向上し、人間の監視や介入への依存を減らす可能性を示しています。

要約(オリジナル)

Many manipulation tasks use instances of a set of common motions, such as a twisting motion for tightening or loosening a valve. However, different instances of the same motion often require different environmental parameters (e.g. force/torque level), and thus different manipulation strategies to successfully complete; for example, grasping a valve handle from the side rather than head-on to increase applied torque. Humans can intuitively adapt their manipulation strategy to best suit such problems, but representing and implementing such behaviors for robots remains an open question. We present a behavior tree-based approach for adaptive manipulation, wherein the robot can reactively select from and switch between a discrete set of manipulation strategies during task execution. Furthermore, our approach allows the robot to learn from past attempts to optimize performance, for example learning the optimal strategy for different task instances. Our approach also allows the robot to preempt task failure and either change to a more feasible strategy or safely exit the task before catastrophic failure occurs. We propose a simple behavior tree design for general adaptive robot behavior and apply it in the context of industrial manipulation. The adaptive behavior outperformed all baseline behaviors that only used a single manipulation strategy, markedly reducing the number of attempts and overall time taken to complete the example tasks. Our results demonstrate potential for improved robustness and efficiency in task completion, reducing dependency on human supervision and intervention.

arxiv情報

著者 Jacques Cloete,Wolfgang Merkt,Ioannis Havoutis
発行日 2024-06-20 18:01:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク