PatchPilot: A Stable and Cost-Efficient Agentic Patching Framework

要約

最近の研究では、大規模な言語モデル(LLMS)と非MLツールを組み合わせたさまざまなパッチングエージェントを構築し、最先端の(SOTA)ソフトウェアパッチングベンチマークであるSWEベンチで有望な結果を達成しています。
パッチングワークフローの決定方法に基づいて、既存のパッチングエージェントは、計画のためにLLMSに依存するエージェントベースの計画方法、および事前定義されたワークフローに従う人間ベースの計画方法に分類できます。
高レベルでは、エージェントベースの計画方法は高いパッチングパフォーマンスを実現しますが、高コストと安定性が限られています。
一方、人間ベースの計画方法はより安定して効率的ですが、パッチのパフォーマンスを損なう重要なワークフロー制限があります。
この論文では、パッチの有効性、安定性、および費用効率のバランスをとるエージェントパッチャーであるPatchPilotを提案します。
PatchPilotは、複製、ローカリゼーション、生成、検証、および改良(洗練がPatchPilotに固有の場合)の5つのコンポーネントを備えた新しい人間ベースの計画ワークフローを提案しています。
各コンポーネントに斬新でカスタマイズされたデザインを紹介して、それらの有効性と効率を最適化します。
SWEベンチベンチマークでの広範な実験を通じて、PatchPilotは既存のオープンソース方法よりも優れたパフォーマンスを示し、低コスト(インスタンスあたり1ドル未満)を維持し、安定性を高めます。
また、各コンポーネントの重要な設計を検証するために、詳細なアブレーション研究も実施します。

要約(オリジナル)

Recent research builds various patching agents that combine large language models (LLMs) with non-ML tools and achieve promising results on the state-of-the-art (SOTA) software patching benchmark, SWE-Bench. Based on how to determine the patching workflows, existing patching agents can be categorized as agent-based planning methods, which rely on LLMs for planning, and human-based planning methods, which follow a pre-defined workflow. At a high level, agent-based planning methods achieve high patching performance but with a high cost and limited stability. Human-based planning methods, on the other hand, are more stable and efficient but have key workflow limitations that compromise their patching performance. In this paper, we propose PatchPilot, an agentic patcher that strikes a balance between patching efficacy, stability, and cost-efficiency. PatchPilot proposes a novel human-based planning workflow with five components: reproduction, localization, generation, validation, and refinement (where refinement is unique to PatchPilot). We introduce novel and customized designs to each component to optimize their effectiveness and efficiency. Through extensive experiments on the SWE-Bench benchmarks, PatchPilot shows a superior performance than existing open-source methods while maintaining low cost (less than 1$ per instance) and ensuring higher stability. We also conduct a detailed ablation study to validate the key designs in each component.

arxiv情報

著者 Hongwei Li,Yuheng Tang,Shiqi Wang,Wenbo Guo
発行日 2025-02-04 22:30:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR, cs.RO | PatchPilot: A Stable and Cost-Efficient Agentic Patching Framework はコメントを受け付けていません

MuST: Multi-Head Skill Transformer for Long-Horizon Dexterous Manipulation with Skill Progress

要約

ロボットのピッキングとパッキングタスクには、オブジェクトを再配置するためのオブジェクトを再配置するなど、巧妙な操作スキルが必要です。
これらのタスクは、必要なアクションの複雑さと変動性のため、ロボットにとって困難です。
長距離タスクの学習と実行の難しさに取り組むために、マルチヘッドスキルトランス(必須)と呼ばれる新しいフレームワークを提案します。
このモデルは、複数のモーションプリミティブ(スキル)を学習し、連続的に連鎖させるように設計されており、ロボットが複雑なアクションシーケンスを効果的に実行できるようにします。
各スキルに「進行状況」を導入し、次に実行するスキルについてロボットを導き、スキル間のスムーズな移行を確保する必要があります。
さらに、モデルはスキルセットを拡大し、さまざまなサブタスクのシーケンスを効率的に管理できます。
シミュレートされた環境と現実世界の両方の環境での広範な実験は、ロボットが長距離駆除操作タスクを実行するロボットの能力を大幅に向上させる必要があることを示しています。

要約(オリジナル)

Robot picking and packing tasks require dexterous manipulation skills, such as rearranging objects to establish a good grasping pose, or placing and pushing items to achieve tight packing. These tasks are challenging for robots due to the complexity and variability of the required actions. To tackle the difficulty of learning and executing long-horizon tasks, we propose a novel framework called the Multi-Head Skill Transformer (MuST). This model is designed to learn and sequentially chain together multiple motion primitives (skills), enabling robots to perform complex sequences of actions effectively. MuST introduces a ‘progress value’ for each skill, guiding the robot on which skill to execute next and ensuring smooth transitions between skills. Additionally, our model is capable of expanding its skill set and managing various sequences of sub-tasks efficiently. Extensive experiments in both simulated and real-world environments demonstrate that MuST significantly enhances the robot’s ability to perform long-horizon dexterous manipulation tasks.

arxiv情報

著者 Kai Gao,Fan Wang,Erica Aduh,Dylan Randle,Jane Shi
発行日 2025-02-04 22:37:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | MuST: Multi-Head Skill Transformer for Long-Horizon Dexterous Manipulation with Skill Progress はコメントを受け付けていません

DeRi-IGP: Learning to Manipulate Rigid Objects Using Deformable Objects via Iterative Grasp-Pull

要約

ロープなどの変形可能な線形オブジェクト(DLO)を介した剛体オブジェクトのロボット操作は、さまざまな剛性オブジェクト輸送タスクにアプリケーションを備えた新たな研究分野です。
この分野に存在するいくつかの方法は、限られたロボットアクションと運用スペース、貧弱な一般化能力、高価なモデルベースの開発に悩まされています。
これらの課題に対処するために、普遍的に適用可能な移動原始と呼ばれる反復グラスプル(IGP)を提案します。
また、IGPプリミティブをパラメーター化してDLOを操作し、付属の剛性オブジェクトを目的の目標位置に輸送することを学ぶ新しいビジョンベースの神経ポリシーを紹介します。
さらに、分散型アルゴリズム設計により、複数のエージェント間のコラボレーションがDLOを使用して剛性オブジェクトを操作できます。
さまざまなソフトリジッドボディ操作タスクに対して、シミュレートされた環境と現実世界の両方の環境でのアプローチの有効性を評価しました。
現実の世界では、指定された目標位置への剛性オブジェクトの人間のロボット協調的輸送を通じて、分散型アプローチの有効性も実証しています。
また、遠くのオブジェクト取得タスクを解決することにより、IGPプリミティブの大きな動作スペースを紹介します。
最後に、アプローチをいくつかのモデルベースおよび学習ベースのベースラインメソッドと比較しました。
結果は、私たちの方法が他のアプローチを大幅に超えて超えていることを示しています。

要約(オリジナル)

Robotic manipulation of rigid objects via deformable linear objects (DLO) such as ropes is an emerging field of research with applications in various rigid object transportation tasks. A few methods that exist in this field suffer from limited robot action and operational space, poor generalization ability, and expensive model-based development. To address these challenges, we propose a universally applicable moving primitive called Iterative Grasp-Pull (IGP). We also introduce a novel vision-based neural policy that learns to parameterize the IGP primitive to manipulate DLO and transport their attached rigid objects to the desired goal locations. Additionally, our decentralized algorithm design allows collaboration among multiple agents to manipulate rigid objects using DLO. We evaluated the effectiveness of our approach in both simulated and real-world environments for a variety of soft-rigid body manipulation tasks. In the real world, we also demonstrate the effectiveness of our decentralized approach through human-robot collaborative transportation of rigid objects to given goal locations. We also showcase the large operational space of IGP primitive by solving distant object acquisition tasks. Lastly, we compared our approach with several model-based and learning-based baseline methods. The results indicate that our method surpasses other approaches by a significant margin.

arxiv情報

著者 Zixing Wang,Ahmed H. Qureshi
発行日 2025-02-04 22:49:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | DeRi-IGP: Learning to Manipulate Rigid Objects Using Deformable Objects via Iterative Grasp-Pull はコメントを受け付けていません

Planning with affordances: Integrating learned affordance models and symbolic planning

要約

現実世界の環境で働くインテリジェントエージェントは、環境とその能力について学ぶことができなければなりません。これにより、世界の状態に変化して、光選挙環境で複雑なマルチステップタスクを完了することができます。
環境について学ぶことは、さまざまなタスクや環境設定のためにエージェントのアクションセットを再定義することなく、さまざまな複数ステップタスクを実行するために特に重要です。
私たちの作業では、世界のオブジェクトの学習されたアフォーダンスモデルを使用して、既存のタスクとモーション計画のフレームワークを強化し、学習モデルを使用してマルチステップタスクの計画と実行を可能にします。
各タスクは、世界の現在の状態を特定の目標状態に変更すると見なすことができます。
アフォーダンスモデルは、どのアクションが可能か、特定の状態でそれらのアクションを実行する方法を提供します。
シンボリック計画アルゴリズムは、この情報と開始および目標状態を使用して、望ましい目標状態に到達して特定のタスクを完了するための実行可能な計画を作成します。
仮想3Dフォトリアリスティック環境であるAI2-TORでアプローチを実証し、実際のタスクで評価します。
私たちの結果は、エージェントが環境と対話する方法をすばやく学習し、「オブジェクトを邪魔にならないようにするためにオブジェクトを移動する」などのタスクを実行する準備ができていることを示しています。

要約(オリジナル)

Intelligent agents working in real-world environments must be able to learn about the environment and its capabilities which enable them to take actions to change to the state of the world to complete a complex multi-step task in a photorealistic environment. Learning about the environment is especially important to perform various multiple-step tasks without having to redefine an agent’s action set for different tasks or environment settings. In our work, we augment an existing task and motion planning framework with learned affordance models of objects in the world to enable planning and executing multi-step tasks using learned models. Each task can be seen as changing the current state of the world to a given goal state. The affordance models provide us with what actions are possible and how to perform those actions in any given state. A symbolic planning algorithm uses this information and the starting and goal state to create a feasible plan to reach the desired goal state to complete a given task. We demonstrate our approach in a virtual 3D photorealistic environment, AI2-Thor, and evaluate it on real-world tasks. Our results show that our agent quickly learns how to interact with the environment and is well prepared to perform tasks such as ‘Moving an object out of the way to reach the desired location.’

arxiv情報

著者 Rajesh Mangannavar
発行日 2025-02-04 23:15:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO, I.2.8 | Planning with affordances: Integrating learned affordance models and symbolic planning はコメントを受け付けていません

Cross-Modality Embedding of Force and Language for Natural Human-Robot Communication

要約

口頭および触覚コミュニケーションの相乗的な調整のために、力プロファイルと単語の交差モダリティ埋め込みの方法が提示されます。
2人が大きくて重いオブジェクトを一緒に運ぶと、オブジェクトに適用される意図された動きと物理的な力について口頭でのコミュニケーションを通して調整します。
口頭および物理的な手がかりのこの自然統合により、効果的な調整が可能になります。
同様に、人間とロボットの相互作用は、言語と触覚のコミュニケーションのモダリティを統合することにより、このレベルの調整を達成できます。
このホワイトペーパーでは、2つの通信モダリティを効果的かつ相乗的な方法で統合および調整できるように、単語と強制プロファイルを統一された方法で埋め込むためのフレームワークを紹介します。
ここでは、言語と物理力のプロファイルは完全に異なるとみなされますが、2つは統一された潜在空間に埋め込まれ、2つの間の近接性を定量化できることが示されます。
この潜在的な空間では、力のプロファイルと単語がa)互いに補足し、b)個々の効果を統合し、c)交換可能な方法で代用することができます。
まず、クロスモダリティの埋め込みの必要性に対処し、基本的なアーキテクチャとキービルディングブロックテクノロジーが提示されます。
データ収集と実装の課題の方法に対処し、その後に実験結果と議論が続きます。

要約(オリジナル)

A method for cross-modality embedding of force profile and words is presented for synergistic coordination of verbal and haptic communication. When two people carry a large, heavy object together, they coordinate through verbal communication about the intended movements and physical forces applied to the object. This natural integration of verbal and physical cues enables effective coordination. Similarly, human-robot interaction could achieve this level of coordination by integrating verbal and haptic communication modalities. This paper presents a framework for embedding words and force profiles in a unified manner, so that the two communication modalities can be integrated and coordinated in a way that is effective and synergistic. Here, it will be shown that, although language and physical force profiles are deemed completely different, the two can be embedded in a unified latent space and proximity between the two can be quantified. In this latent space, a force profile and words can a) supplement each other, b) integrate the individual effects, and c) substitute in an exchangeable manner. First, the need for cross-modality embedding is addressed, and the basic architecture and key building block technologies are presented. Methods for data collection and implementation challenges will be addressed, followed by experimental results and discussions.

arxiv情報

著者 Ravi Tejwani,Karl Velazquez,John Payne,Paolo Bonato,Harry Asada
発行日 2025-02-04 23:32:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC, cs.RO | Cross-Modality Embedding of Force and Language for Natural Human-Robot Communication はコメントを受け付けていません

SD++: Enhancing Standard Definition Maps by Incorporating Road Knowledge using LLMs

要約

高解像度マップ(HDマップ)は、レーンセンターラインと道路要素をキャプチャする詳細かつ有益なマップです。
自律運転には非常に便利ですが、HDマップは構築と保守に費用がかかります。
さらに、これらの高品質のマップへのアクセスは、通常、それらを構築する企業に限定されます。
一方、標準の定義(SD)マップは、数メートルの精度をロードセンターラインに提供します。
この論文では、LLMSを使用して道路マニュアルから情報を組み込むことにより、SDマップを強化する可能性を探ります。
SD ++は、道路マニュアルから得られた場所に依存した道路情報を使用してSDマップを強化するエンドツーエンドパイプラインである開発を開発します。
このようなタスクにLLMを使用するいくつかの方法を提案し、比較します。
さらに、カリフォルニアと日本の両方の結果を示すことにより、SD ++の一般化能力を示します。

要約(オリジナル)

High-definition maps (HD maps) are detailed and informative maps capturing lane centerlines and road elements. Although very useful for autonomous driving, HD maps are costly to build and maintain. Furthermore, access to these high-quality maps is usually limited to the firms that build them. On the other hand, standard definition (SD) maps provide road centerlines with an accuracy of a few meters. In this paper, we explore the possibility of enhancing SD maps by incorporating information from road manuals using LLMs. We develop SD++, an end-to-end pipeline to enhance SD maps with location-dependent road information obtained from a road manual. We suggest and compare several ways of using LLMs for such a task. Furthermore, we show the generalization ability of SD++ by showing results from both California and Japan.

arxiv情報

著者 Hitvarth Diwanji,Jing-Yan Liao,Akshar Tumu,Henrik I. Christensen,Marcell Vazquez-Chanlatte,Chikao Tsuchiya
発行日 2025-02-04 23:35:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | SD++: Enhancing Standard Definition Maps by Incorporating Road Knowledge using LLMs はコメントを受け付けていません

To Ask or Not To Ask: Human-in-the-loop Contextual Bandits with Applications in Robot-Assisted Feeding

要約

ロボット支援の噛み付きの獲得には、さまざまな形状、コンプライアンス、サイズ、テクスチャで食品を拾うことが含まれます。
完全に自律的な戦略は、この多様性全体で効率的に一般化することはできません。
新しい食品に遭遇したときに、ケアの受信者からのフィードバックを活用することを提案します。
ただし、頻繁にクエリがユーザーにワークロードを課します。
コンテキストバンディットフレームワーク内でループインバイトの獲得を策定し、linucb-QGを導入します。これは、クエリの種類とタイミングに基づいてワークロードのクエリの予測モデルを使用して選択的に要求する方法です。
このモデルは、モビリティ制限のある14人の参加者、3人の作業療法士が物理的制限をシミュレートする3人の参加者、および89人の参加者が制限されていないオンライン調査で収集されたデータでトレーニングされています。
私たちの方法は、自律的で常にクエリのベースラインと比較して、タスクのパフォーマンスとクエリのワークロードのバランスをより良くし、モビリティの制限を持つユーザーのより高いワークロードを説明するためにクエリの動作を調整することを実証します。
シミュレートされた食品データセットでの実験と、重度のモビリティの制限を含む1人を含む19人の参加者を対象としたユーザー調査を通じて、これを検証します。
プロジェクトWebサイトをご覧ください:http://emprise.cs.cornell.edu/hilbiteacquisition/

要約(オリジナル)

Robot-assisted bite acquisition involves picking up food items with varying shapes, compliance, sizes, and textures. Fully autonomous strategies may not generalize efficiently across this diversity. We propose leveraging feedback from the care recipient when encountering novel food items. However, frequent queries impose a workload on the user. We formulate human-in-the-loop bite acquisition within a contextual bandit framework and introduce LinUCB-QG, a method that selectively asks for help using a predictive model of querying workload based on query types and timings. This model is trained on data collected in an online study involving 14 participants with mobility limitations, 3 occupational therapists simulating physical limitations, and 89 participants without limitations. We demonstrate that our method better balances task performance and querying workload compared to autonomous and always-querying baselines and adjusts its querying behavior to account for higher workload in users with mobility limitations. We validate this through experiments in a simulated food dataset and a user study with 19 participants, including one with severe mobility limitations. Please check out our project website at: http://emprise.cs.cornell.edu/hilbiteacquisition/

arxiv情報

著者 Rohan Banerjee,Rajat Kumar Jenamani,Sidharth Vasudev,Amal Nanavati,Katherine Dimitropoulou,Sarah Dean,Tapomayukh Bhattacharjee
発行日 2025-02-05 00:23:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | To Ask or Not To Ask: Human-in-the-loop Contextual Bandits with Applications in Robot-Assisted Feeding はコメントを受け付けていません

AAM-SEALS: Developing Aerial-Aquatic Manipulators in SEa, Air, and Land Simulator

要約

現在のモバイルマニピュレーターと高忠実度のシミュレータには、海、空気、土地にまたがる統合された環境全体でシームレスに動作およびシミュレートする能力がありません。
このギャップに対処するために、AAMがこれらの多様な環境で動作して学習するために設計された包括的で光リアリスティックなシミュレーターである海、空気、およびランドシミュレーター(SEALS)に航空水生マニピュレーター(AAM)を紹介します。
AAMシールの開発は、飛行、水泳、操作のための統合コントローラーの作成、航空ダイナミクスの高忠実度シミュレーションや粒子ベースの流体力学を活用する流体力学など、いくつかの重要な課題に取り組んでいます。
私たちの評価は、滑らかな動作と、空気、水、およびそれらのインターフェイスを介した光エリアスティックな遷移を示しています。
現実世界とシミュレートされたシステム間の位置追跡エラーを比較することにより、粒子ベースの流体力学の忠実度を定量的に検証します。
AAMシールは、ロボット学習、空中ロボット工学、水中ロボット工学、モバイル操作、ロボットシミュレーターなど、幅広いロボットコミュニティに利益をもたらします。
これらの分野での研究の進歩を促進するために、コードとデータをオープンソーシングします。
概要ビデオは、https://youtu.be/mbqiiryvr78で入手できます。
詳細については、プロジェクトWebサイトhttps://aam-seals-v1.umd.eduをご覧ください。

要約(オリジナル)

Current mobile manipulators and high-fidelity simulators lack the ability to seamlessly operate and simulate across integrated environments spanning sea, air, and land. To address this gap, we introduce Aerial-Aquatic Manipulators (AAMs) in SEa, Air, and Land Simulator (SEALS), a comprehensive and photorealistic simulator designed for AAMs to operate and learn in these diverse environments. The development of AAM-SEALS tackles several significant challenges, including the creation of integrated controllers for flying, swimming, and manipulation, and the high-fidelity simulation of aerial dynamics and hydrodynamics leveraging particle-based hydrodynamics. Our evaluation demonstrates smooth operation and photorealistic transitions across air, water, and their interfaces. We quantitatively validate the fidelity of particle-based hydrodynamics by comparing position-tracking errors across real-world and simulated systems. AAM-SEALS benefits a broad range of robotics communities, including robot learning, aerial robotics, underwater robotics, mobile manipulation, and robotic simulators. We will open-source our code and data to foster the advancement of research in these fields. The overview video is available at https://youtu.be/MbqIIrYvR78. Visit our project website at https://aam-seals-v1.umd.edu for more details.

arxiv情報

著者 William Yang,Karthikeya Kona,Yashveer Jain,Tomer Atzili,Abhinav Bhamidipati,Xiaomin Lin,Yantian Zha
発行日 2025-02-05 01:18:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | AAM-SEALS: Developing Aerial-Aquatic Manipulators in SEa, Air, and Land Simulator はコメントを受け付けていません

MapEval: Towards Unified, Robust and Efficient SLAM Map Evaluation Framework

要約

主に統一された堅牢で効率的な評価フレームワークが存在しないため、同時ローカリゼーションとマッピング(SLAM)の大規模なポイントクラウドマップの評価(SLAM)は依然として挑戦的です。
ポイントクラウドマップの包括的な品質評価のためのオープンソースフレームワークであるMapevalを提示します。特に、グラウンドトゥルースマップがマッピングされた環境と比較して本質的にまばらであるスラムシナリオに対処します。
SLAMアプリケーションでの既存の評価メトリックの体系的な分析を通じて、それらの基本的な制限を特定し、一貫したマップ品質評価のための明確なガイドラインを確立します。
これらの洞察に基づいて、私たちはボクセル化空間での新しいガウス補助ワッサースタイン距離を提案し、同じエラー標準の下で2つの相補的なメトリックを可能にします:ボクセル化された平均ワッサースタイン距離(AWD)。

この理論的基礎は、従来のメトリックと比較して、ノイズと計算効率に対する堅牢性の両方の大幅な改善につながります。
シミュレートされたデータセットと実際のデータセットの両方での広範な実験は、Mapevalが評価の完全性を維持しながら、少なくとも\ si {100} – \ si {500} {} {} {} {} {} {} {} {} {}を達成することを示しています。
Mapeval Library \ footnote {\ texttt {https://github.com/jokerjohn/cloud\_map\_evaluation}}は、ロボットコミュニティの標準化されたマップ評価プラクティスを促進するために公開されます。

要約(オリジナル)

Evaluating massive-scale point cloud maps in Simultaneous Localization and Mapping (SLAM) remains challenging, primarily due to the absence of unified, robust and efficient evaluation frameworks. We present MapEval, an open-source framework for comprehensive quality assessment of point cloud maps, specifically addressing SLAM scenarios where ground truth map is inherently sparse compared to the mapped environment. Through systematic analysis of existing evaluation metrics in SLAM applications, we identify their fundamental limitations and establish clear guidelines for consistent map quality assessment. Building upon these insights, we propose a novel Gaussian-approximated Wasserstein distance in voxelized space, enabling two complementary metrics under the same error standard: Voxelized Average Wasserstein Distance (AWD) for global geometric accuracy and Spatial Consistency Score (SCS) for local consistency evaluation. This theoretical foundation leads to significant improvements in both robustness against noise and computational efficiency compared to conventional metrics. Extensive experiments on both simulated and real-world datasets demonstrate that MapEval achieves at least \SI{100}{}-\SI{500}{} times faster while maintaining evaluation integrity. The MapEval library\footnote{\texttt{https://github.com/JokerJohn/Cloud\_Map\_Evaluation}} will be publicly available to promote standardized map evaluation practices in the robotics community.

arxiv情報

著者 Xiangcheng Hu,Jin Wu,Mingkai Jia,Hongyu Yan,Yi Jiang,Binqian Jiang,Wei Zhang,Wei He,Ping Tan
発行日 2025-02-05 02:13:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | MapEval: Towards Unified, Robust and Efficient SLAM Map Evaluation Framework はコメントを受け付けていません

Global Contact-Rich Planning with Sparsity-Rich Semidefinite Relaxations

要約

多項式最適化(POP)と見なされると、接触が豊富なモーション計画もスパースリッチであることを示します。
すべてのポップに一般的な相関および用語のスパースパターンだけでなく、ロボットの運動学的構造と接触モードの分離性からの特殊なスパースパターンも活用できます。
このようなスパース性により、高次がまばらなセミドフィニットプログラミング(SDPS)緩和 – ラセレの瞬間と正方形の階層の合計を構築することを可能にします。
ii)少数の認定されたサブ最適性を備えた、非コンベックスの接触豊富な計画問題に対するグローバルに最適なソリューションに近いと計算されます。
シミュレーション(プッシュボット、プッシュボックス、障害物を備えたプッシュボックス、プラナーハンドのプッシュボックス)と現実世界(プッシュT)の両方で広範な実験を通じて、凸型SDP緩和を使用してグローバルな接触リッチモーションプランを生成する力を示します。
独立した関心の貢献として、PythonとMatlabの両方にインターフェイスを備えたC ++で実装されたスパース多項式最適化ツールボックス(SPOT)をリリースします。

要約(オリジナル)

We show that contact-rich motion planning is also sparsity-rich when viewed as polynomial optimization (POP). We can exploit not only the correlative and term sparsity patterns that are general to all POPs, but also specialized sparsity patterns from the robot kinematic structure and the separability of contact modes. Such sparsity enables the design of high-order but sparse semidefinite programming (SDPs) relaxations–building upon Lasserre’s moment and sums of squares hierarchy–that (i) can be solved in seconds by off-the-shelf SDP solvers, and (ii) compute near globally optimal solutions to the nonconvex contact-rich planning problems with small certified suboptimality. Through extensive experiments both in simulation (Push Bot, Push Box, Push Box with Obstacles, and Planar Hand) and real world (Push T), we demonstrate the power of using convex SDP relaxations to generate global contact-rich motion plans. As a contribution of independent interest, we release the Sparse Polynomial Optimization Toolbox (SPOT)–implemented in C++ with interfaces to both Python and Matlab–that automates sparsity exploitation for robotics and beyond.

arxiv情報

著者 Shucheng Kang,Guorui Liu,Heng Yang
発行日 2025-02-05 02:13:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, math.OC | Global Contact-Rich Planning with Sparsity-Rich Semidefinite Relaxations はコメントを受け付けていません