要約
このホワイトペーパーでは、SAPIEN ManiSkill Challenge 2021の次の2つのトラック用に設計されたシステムの概要と比較分析を示します。インタラクションなしのトラック:事前に収集されたデモンストレーションの軌跡からポリシーを学習するためのインタラクションなしのトラックターゲット。
このトラックでは、模倣学習ベースのアプローチ、つまり、古典的な教師あり学習手法を使用して観察された行動を模倣するアプローチと、オフライン強化学習ベースのアプローチの両方を調査します。
さらに、オブジェクトとロボットアームのジオメトリとテクスチャ構造は、模倣学習を容易にするためにTransformerベースのネットワークを介して活用されます。
制限なしトラック:このトラックでは、タスクを一連のサブタスクに分解することにより、高品質のオブジェクト操作をトリガーするヒューリスティックルールベースの方法(HRM)を設計します。
サブタスクごとに、単純なルールベースの制御戦略を採用して、ロボットアームに適用できるアクションを予測します。
システムの実装を容易にするために、すべてのソースコードと事前トレーニング済みモデルは\url{https://github.com/caiqi/Silver-Bullet-3D/}で入手できます。
要約(オリジナル)
This paper presents an overview and comparative analysis of our systems designed for the following two tracks in SAPIEN ManiSkill Challenge 2021: No Interaction Track: The No Interaction track targets for learning policies from pre-collected demonstration trajectories. We investigate both imitation learning-based approach, i.e., imitating the observed behavior using classical supervised learning techniques, and offline reinforcement learning-based approaches, for this track. Moreover, the geometry and texture structures of objects and robotic arms are exploited via Transformer-based networks to facilitate imitation learning. No Restriction Track: In this track, we design a Heuristic Rule-based Method (HRM) to trigger high-quality object manipulation by decomposing the task into a series of sub-tasks. For each sub-task, the simple rule-based controlling strategies are adopted to predict actions that can be applied to robotic arms. To ease the implementations of our systems, all the source codes and pre-trained models are available at \url{https://github.com/caiqi/Silver-Bullet-3D/}.
arxiv情報
著者 | Yingwei Pan,Yehao Li,Yiheng Zhang,Qi Cai,Fuchen Long,Zhaofan Qiu,Ting Yao,Tao Mei |
発行日 | 2022-06-13 16:20:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google