要約
観測データから学習したニューラルネットワークベースのダイナミクスモデルは、ロボット操作タスクにおけるシーンダイナミクスの強力な予測能力を示しています。
ただし、その固有の非線形性により、効果的な計画を立てるには大きな課題が生じます。
現在の計画手法は、大規模なサンプリングや局所的な勾配降下に依存することが多く、複雑な接触イベントを伴う長期的な運動計画タスクに苦労しています。
この論文では、ニューラル ダイナミクス モデルに対する軌道の最適化を必要とする操作タスクにおける動作計画のための、GPU アクセラレーションによる分岐限定 (BaB) フレームワークを紹介します。
私たちのアプローチは、特殊な分岐ヒューリスティックを採用して検索空間をサブドメインに分割し、最先端のニューラル ネットワーク検証ツール alpha-beta-CROWN からインスピレーションを得た修正された境界伝播手法を適用して、これらのサブドメイン内の客観的な境界を効率的に推定します。
。
分岐プロセスは計画を効果的に導きますが、境界プロセスは戦略的に検索スペースを削減します。
私たちのフレームワークは、シミュレーションと現実世界の両方で、障害物による掴みにくい平面の押し出し、オブジェクトの分類、ロープのルーティングなどの困難で接触の多い操作タスクにおいて、高品質の状態アクション軌道を生成し、既存の方法を超えて優れた計画パフォーマンスを実現します。
設定。
さらに、私たちのフレームワークは、単純な多層パーセプトロンから高度なグラフ ニューラル ダイナミクス モデルに至るまで、さまざまなニューラル ネットワーク アーキテクチャをサポートしており、さまざまなモデル サイズに合わせて効率的に拡張できます。
要約(オリジナル)
Neural-network-based dynamics models learned from observational data have shown strong predictive capabilities for scene dynamics in robotic manipulation tasks. However, their inherent non-linearity presents significant challenges for effective planning. Current planning methods, often dependent on extensive sampling or local gradient descent, struggle with long-horizon motion planning tasks involving complex contact events. In this paper, we present a GPU-accelerated branch-and-bound (BaB) framework for motion planning in manipulation tasks that require trajectory optimization over neural dynamics models. Our approach employs a specialized branching heuristics to divide the search space into subdomains, and applies a modified bound propagation method, inspired by the state-of-the-art neural network verifier alpha-beta-CROWN, to efficiently estimate objective bounds within these subdomains. The branching process guides planning effectively, while the bounding process strategically reduces the search space. Our framework achieves superior planning performance, generating high-quality state-action trajectories and surpassing existing methods in challenging, contact-rich manipulation tasks such as non-prehensile planar pushing with obstacles, object sorting, and rope routing in both simulated and real-world settings. Furthermore, our framework supports various neural network architectures, ranging from simple multilayer perceptrons to advanced graph neural dynamics models, and scales efficiently with different model sizes.
arxiv情報
著者 | Keyi Shen,Jiangwei Yu,Huan Zhang,Yunzhu Li |
発行日 | 2024-12-12 18:55:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google