要約
変形可能なオブジェクト操作 (DOM) は、日常的なアプリケーションと産業用アプリケーションの両方にとって非常に重要です。
微分可能な物理シミュレーターにおける最近の成功により、学習アルゴリズムは、環境ダイナミクスを通じて分析勾配を使用してポリシーをトレーニングできます。これにより、DOM アルゴリズムの開発が大幅に促進されます。
ただし、既存の DOM ベンチマークは、単一オブジェクト ベースか微分不可能です。
これにより、1) タスク固有のアルゴリズムが他のタスクでどのように実行されるか、および 2) 微分可能な物理学ベースのアルゴリズムが一般に微分不可能なアルゴリズムとどのように比較されるかという問題が残ります。
この作業では、幅広いオブジェクトとタスクをカバーする微分可能な DOM ベンチマークである DaXBench を紹介します。
DaXBench には、さまざまな難易度のロープ、布、液体の操作をカバーする 9 つのやりがいのある忠実度の高いシミュレートされたタスクが含まれています。
さまざまな DOM タスクでの一般的なアルゴリズムのパフォーマンスをよりよく理解するために、計画から模倣学習、強化学習に至るまで、代表的な DOM メソッドについて包括的な実験を行います。
さらに、微分可能な物理学に基づく既存の意思決定アルゴリズムの慎重な経験的研究を提供し、それらの限界と潜在的な将来の方向性について議論します。
要約(オリジナル)
Deformable Object Manipulation (DOM) is of significant importance to both daily and industrial applications. Recent successes in differentiable physics simulators allow learning algorithms to train a policy with analytic gradients through environment dynamics, which significantly facilitates the development of DOM algorithms. However, existing DOM benchmarks are either single-object-based or non-differentiable. This leaves the questions of 1) how a task-specific algorithm performs on other tasks and 2) how a differentiable-physics-based algorithm compares with the non-differentiable ones in general. In this work, we present DaXBench, a differentiable DOM benchmark with a wide object and task coverage. DaXBench includes 9 challenging high-fidelity simulated tasks, covering rope, cloth, and liquid manipulation with various difficulty levels. To better understand the performance of general algorithms on different DOM tasks, we conduct comprehensive experiments over representative DOM methods, ranging from planning to imitation learning and reinforcement learning. In addition, we provide careful empirical studies of existing decision-making algorithms based on differentiable physics, and discuss their limitations, as well as potential future directions.
arxiv情報
著者 | Siwei Chen,Yiqing Xu,Cunjun Yu,Linfeng Li,Xiao Ma,Zhongwen Xu,David Hsu |
発行日 | 2023-03-10 07:27:19+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google