要約
観察データから学んだニューラルネットワークベースのダイナミクスモデルは、ロボット操作タスクのシーンダイナミクスの強力な予測機能を示しています。
ただし、それらの固有の非線形性は、効果的な計画のための重要な課題を提示します。
多くの場合、広範なサンプリングまたはローカルグラジエントの降下に依存している現在の計画方法は、複雑な接触イベントを含む長老のモーション計画タスクと闘っています。
このホワイトペーパーでは、ニューラルダイナミクスモデルよりも軌跡最適化を必要とする操作タスクにおけるモーション計画のためのGPUアクセラレーションの枝とバインド(BAB)フレームワークを紹介します。
私たちのアプローチは、検索空間をサブドメインに分割するために特殊な分岐ヒューリスティックを採用しており、最先端のニューラルネットワーク検証剤アルファベータクラウンに触発された修正されたバウンド伝播法を適用して、これらのサブドメイン内の客観的境界を効率的に推定する
。
分岐プロセスは計画を効果的にガイドし、境界プロセスは検索スペースを戦略的に削減します。
私たちのフレームワークは、優れた計画パフォーマンスを達成し、高品質の状態アクション軌跡を生成し、障害物、オブジェクトの並べ替え、シミュレーションおよび実世界の両方のルーティングでプッシュする非充実した平面的な平面などの挑戦的な接触豊富な操作タスクで既存の方法を上回ります
設定。
さらに、当社のフレームワークは、単純な多層パーセプトロンから高度なグラフニューラルダイナミクスモデルに至るまで、さまざまなモデルサイズで効率的にスケールに至るまで、さまざまなニューラルネットワークアーキテクチャをサポートしています。
要約(オリジナル)
Neural-network-based dynamics models learned from observational data have shown strong predictive capabilities for scene dynamics in robotic manipulation tasks. However, their inherent non-linearity presents significant challenges for effective planning. Current planning methods, often dependent on extensive sampling or local gradient descent, struggle with long-horizon motion planning tasks involving complex contact events. In this paper, we present a GPU-accelerated branch-and-bound (BaB) framework for motion planning in manipulation tasks that require trajectory optimization over neural dynamics models. Our approach employs a specialized branching heuristics to divide the search space into subdomains, and applies a modified bound propagation method, inspired by the state-of-the-art neural network verifier alpha-beta-CROWN, to efficiently estimate objective bounds within these subdomains. The branching process guides planning effectively, while the bounding process strategically reduces the search space. Our framework achieves superior planning performance, generating high-quality state-action trajectories and surpassing existing methods in challenging, contact-rich manipulation tasks such as non-prehensile planar pushing with obstacles, object sorting, and rope routing in both simulated and real-world settings. Furthermore, our framework supports various neural network architectures, ranging from simple multilayer perceptrons to advanced graph neural dynamics models, and scales efficiently with different model sizes.
arxiv情報
著者 | Keyi Shen,Jiangwei Yu,Jose Barreiros,Huan Zhang,Yunzhu Li |
発行日 | 2025-02-05 07:57:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google