Online Tool Selection with Learned Grasp Prediction Models

要約

深層学習ベースの把握予測モデルは、ロボットによるビンピッキング システムの業界標準になりました。
ピッキングの成功を最大化するために、多くの場合、本番環境には、ターゲット オブジェクトに基づいてオンザフライで交換できるいくつかのエンド エフェクタ ツールが装備されています。
ただし、ツールの交換には時間がかかります。
実行する把持の順序と対応するツール交換アクションを選択すると、システムのスループットを向上させることができます。
これが私たちの仕事のテーマです。
ツールの変更を計画する際の主な課題は、不確実性です。通常、現在遮られているビン内のオブジェクトを見ることはできません。
待ち行列とアドミッション制御の問題に着想を得て、問題をマルコフ決定プロセス (MDP) としてモデル化します。この目標は、期待されるスループットを最大化することであり、モデル予測制御に基づいて近似解を追求します。
現在表示されているオブジェクトのみ。
私たちの方法にとって特別なのは、未知のオブジェクトが存在する幾何学的な境界であるボイドゾーンのアイデアであり、したがって計画中に説明することはできません.
計画の問題は、整数線形計画法 (ILP) を使用して解決できます。
ただし、疎なツリー検索に基づく近似解は、わずかな時間でほぼ最適なパフォーマンスをもたらすことがわかりました。
私たちが探求しているもう 1 つの問題は、ツール交換計画のパフォーマンスを測定する方法です。スループットだけでは、繊細でスムーズな動作を捉えることができず、原則に基づいた代替案を提案することができます。
最後に、合成および実世界のビンピッキングタスクの両方でアルゴリズムを示します。

要約(オリジナル)

Deep learning-based grasp prediction models have become an industry standard for robotic bin-picking systems. To maximize pick success, production environments are often equipped with several end-effector tools that can be swapped on-the-fly, based on the target object. Tool-change, however, takes time. Choosing the order of grasps to perform, and corresponding tool-change actions, can improve system throughput; this is the topic of our work. The main challenge in planning tool change is uncertainty – we typically cannot see objects in the bin that are currently occluded. Inspired by queuing and admission control problems, we model the problem as a Markov Decision Process (MDP), where the goal is to maximize expected throughput, and we pursue an approximate solution based on model predictive control, where at each time step we plan based only on the currently visible objects. Special to our method is the idea of void zones, which are geometrical boundaries in which an unknown object will be present, and therefore cannot be accounted for during planning. Our planning problem can be solved using integer linear programming (ILP). However, we find that an approximate solution based on sparse tree search yields near optimal performance at a fraction of the time. Another question that we explore is how to measure the performance of tool-change planning: we find that throughput alone can fail to capture delicate and smooth behavior, and propose a principled alternative. Finally, we demonstrate our algorithms on both synthetic and real world bin picking tasks.

arxiv情報

著者 Khashayar Rohanimanesh,Jake Metzger,William Richards,Aviv Tamar
発行日 2023-02-15 20:52:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク