Canonical Representation and Force-Based Pretraining of 3D Tactile for Dexterous Visuo-Tactile Policy Learning

要約

触覚センシングは、ロボットがきめ細かい接触豊富なタスクを実行できるようにする上で重要な役割を果たします。
ただし、器用な手に大きなカバレッジがあるため、触覚データの高次元は、特に標準化されたデータセットが大きく、強力な前提型の骨格がないため、効果的な触覚機能学習に大きな課題をもたらします。
これらの課題に対処するために、3D触覚機能学習の難しさを軽減する新しい標準表現を提案し、局所的および正味の力の両方の特徴をキャプチャするための力に基づく自己監視前の事前削除タスクをさらに導入します。
私たちの方法は、実際の実験で4つのきめの細かい接触豊富な巧妙な操作タスクにわたって平均成功率を達成し、他の方法と比較して有効性と堅牢性を示しています。
さらなる分析により、この方法は、3D触覚データからの空間情報と力情報の両方を完全に利用して、タスクを達成することが示されています。
ビデオはhttps://3dtacdex.github.ioで見ることができます。

要約(オリジナル)

Tactile sensing plays a vital role in enabling robots to perform fine-grained, contact-rich tasks. However, the high dimensionality of tactile data, due to the large coverage on dexterous hands, poses significant challenges for effective tactile feature learning, especially for 3D tactile data, as there are no large standardized datasets and no strong pretrained backbones. To address these challenges, we propose a novel canonical representation that reduces the difficulty of 3D tactile feature learning and further introduces a force-based self-supervised pretraining task to capture both local and net force features, which are crucial for dexterous manipulation. Our method achieves an average success rate of 78% across four fine-grained, contact-rich dexterous manipulation tasks in real-world experiments, demonstrating effectiveness and robustness compared to other methods. Further analysis shows that our method fully utilizes both spatial and force information from 3D tactile data to accomplish the tasks. The videos can be viewed at https://3dtacdex.github.io.

arxiv情報

著者 Tianhao Wu,Jinzhou Li,Jiyao Zhang,Mingdong Wu,Hao Dong
発行日 2025-02-10 02:27:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Canonical Representation and Force-Based Pretraining of 3D Tactile for Dexterous Visuo-Tactile Policy Learning はコメントを受け付けていません

CDM: Contact Diffusion Model for Multi-Contact Point Localization

要約

このホワイトペーパーでは、マルチコンタクトポイントローカリゼーションのための新しい学習ベースのアプローチであるコンタクト拡散モデル(CDM)を提案します。
ベースにジョイントトルクセンサーと力/トルクセンサーを装備したロボットを検討します。
拡散モデルを活用することにより、CDMは、複数の接点ポイントと力のペアが同一のセンサー測定値を生成する特異点に対処します。
マルチコンタクトシナリオの時間依存特性を説明するために、過去のモデル出力に条件付けられるCDMを策定します。
さらに、ロボット表面の複雑な形状に効果的に対処するために、除去プロセスに署名された距離フィールドを組み込みます。
その結果、CDMは任意の場所で連絡先を高い精度でローカライズできます。
シミュレーションと現実世界の実験は、提案された方法の有効性を示しています。
特に、CDMは15.97msで動作し、現実の世界では、単一接触シナリオで0.44cm、デュアルコンタクトシナリオで1.24cmのエラーを達成します。

要約(オリジナル)

In this paper, we propose a Contact Diffusion Model (CDM), a novel learning-based approach for multi-contact point localization. We consider a robot equipped with joint torque sensors and a force/torque sensor at the base. By leveraging a diffusion model, CDM addresses the singularity where multiple pairs of contact points and forces produce identical sensor measurements. We formulate CDM to be conditioned on past model outputs to account for the time-dependent characteristics of the multi-contact scenarios. Moreover, to effectively address the complex shape of the robot surfaces, we incorporate the signed distance field in the denoising process. Consequently, CDM can localize contacts at arbitrary locations with high accuracy. Simulation and real-world experiments demonstrate the effectiveness of the proposed method. In particular, CDM operates at 15.97ms and, in the real world, achieves an error of 0.44cm in single-contact scenarios and 1.24cm in dual-contact scenarios.

arxiv情報

著者 Seo Wook Han,Min Jun Kim
発行日 2025-02-10 02:44:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | CDM: Contact Diffusion Model for Multi-Contact Point Localization はコメントを受け付けていません

Towards Bio-inspired Heuristically Accelerated Reinforcement Learning for Adaptive Underwater Multi-Agents Behaviour

要約

このホワイトペーパーでは、複雑な環境でのカバレッジ計画の問題を解決することを目的とした自律的なマルチエージェントシステムの調整の問題について説明します。
考慮されたアプリケーションは、エリアをカバーしながら、関心のあるオブジェクトの検出と識別です。
スペースアプリケーションに非常に関連するこれらのタスクは、この研究の焦点である水中コンテキストを含むさまざまなドメインの間でも興味深いものです。
これに関連して、カバレッジ計画は、伝統的に、領域を調査してオブジェクトを検索するために、異質な自律的な水中車両の群れである調整されたMASが必要な調整されたMASが必要なマルコフ決定プロセスとしてモデル化されています。
このMDPは、環境の不確実性、コミュニケーションの制約、および水中環境における時変と予測不可能な変化を含む危険のアンサンブルなど、いくつかの課題に関連しています。
Marlアルゴリズムは、深いニューラルネットワークを使用して非常に非線形の問題を解決し、エージェントの増加に対して優れたスケーラビリティを表示できます。
それにもかかわらず、水中ドメインでの現在の結果のほとんどは、MARLアルゴリズムの高い学習時間のためにシミュレーションに限定されています。
このため、生物学的にインスパイアされたヒューリスティックを組み込み、トレーニング中に政策を導くことにより、この収束率を加速するための新しい戦略が導入されています。
動物のグループの行動に触発されたPSOメソッドは、ヒューリスティックとして選択されます。
これにより、ポリシーは、トレーニングの開始から、アクションと状態空間の最高品質の領域を探索し、探査/搾取のトレードオフを最適化できます。
結果のエージェントは、最適なパフォーマンスに到達するためにより少ない相互作用が必要です。
この方法はMSACアルゴリズムに適用され、連続制御環境での2Dカバーエリアミッションについて評価されます。

要約(オリジナル)

This paper describes the problem of coordination of an autonomous Multi-Agent System which aims to solve the coverage planning problem in a complex environment. The considered applications are the detection and identification of objects of interest while covering an area. These tasks, which are highly relevant for space applications, are also of interest among various domains including the underwater context, which is the focus of this study. In this context, coverage planning is traditionally modelled as a Markov Decision Process where a coordinated MAS, a swarm of heterogeneous autonomous underwater vehicles, is required to survey an area and search for objects. This MDP is associated with several challenges: environment uncertainties, communication constraints, and an ensemble of hazards, including time-varying and unpredictable changes in the underwater environment. MARL algorithms can solve highly non-linear problems using deep neural networks and display great scalability against an increased number of agents. Nevertheless, most of the current results in the underwater domain are limited to simulation due to the high learning time of MARL algorithms. For this reason, a novel strategy is introduced to accelerate this convergence rate by incorporating biologically inspired heuristics to guide the policy during training. The PSO method, which is inspired by the behaviour of a group of animals, is selected as a heuristic. It allows the policy to explore the highest quality regions of the action and state spaces, from the beginning of the training, optimizing the exploration/exploitation trade-off. The resulting agent requires fewer interactions to reach optimal performance. The method is applied to the MSAC algorithm and evaluated for a 2D covering area mission in a continuous control environment.

arxiv情報

著者 Antoine Vivien,Thomas Chaffre,Matthew Stephenson,Eva Artusi,Paulo Santos,Benoit Clement,Karl Sammut
発行日 2025-02-10 02:47:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Towards Bio-inspired Heuristically Accelerated Reinforcement Learning for Adaptive Underwater Multi-Agents Behaviour はコメントを受け付けていません

Real-Time LiDAR Point Cloud Compression and Transmission for Resource-constrained Robots

要約

Lidarsは、正確な環境構造情報を提供する能力により、自律ロボットで広く使用されています。
ただし、ポイントクラウドのサイズが大きいため、データストレージと送信に関して課題があります。
この論文では、RCPCCと呼ばれるリソース制約のロボットアプリケーションの新しいポイントクラウド圧縮とトランスミッションフレームワークを提案します。
ポイントクラウドの表面に同様の範囲値を繰り返し適合し、空間的関係を通じて冗長性を排除します。
次に、形状適応DCT(SA-DCT)を使用して、変換された係数を量子化することにより、不適切なポイントを変換し、データ量を減らします。
QOEに基づいて、送信されたポイントクラウドの品質を制御する最適化の目標として、適応型ビットレート制御戦略を設計します。
実験は、私たちのフレームワークが40 $ \ times $ $ 80 $ \ times $の圧縮率を達成し、下流のアプリケーションの高精度を維持することを示しています。
この方法は、圧縮速度が70 $ \ Times $を超える場合、精度の点で他のベースラインを大幅に上回っています。
さらに、通信帯域幅の減少の状況では、適応的なビットレート制御戦略が大幅にQOEの改善を示しています。
このコードは、https://github.com/hitsz-nrsl/rcpcc.gitで入手できます。

要約(オリジナル)

LiDARs are widely used in autonomous robots due to their ability to provide accurate environment structural information. However, the large size of point clouds poses challenges in terms of data storage and transmission. In this paper, we propose a novel point cloud compression and transmission framework for resource-constrained robotic applications, called RCPCC. We iteratively fit the surface of point clouds with a similar range value and eliminate redundancy through their spatial relationships. Then, we use Shape-adaptive DCT (SA-DCT) to transform the unfit points and reduce the data volume by quantizing the transformed coefficients. We design an adaptive bitrate control strategy based on QoE as the optimization goal to control the quality of the transmitted point cloud. Experiments show that our framework achieves compression rates of 40$\times$ to 80$\times$ while maintaining high accuracy for downstream applications. our method significantly outperforms other baselines in terms of accuracy when the compression rate exceeds 70$\times$. Furthermore, in situations of reduced communication bandwidth, our adaptive bitrate control strategy demonstrates significant QoE improvements. The code will be available at https://github.com/HITSZ-NRSL/RCPCC.git.

arxiv情報

著者 Yuhao Cao,Yu Wang,Haoyao Chen
発行日 2025-02-10 03:21:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Real-Time LiDAR Point Cloud Compression and Transmission for Resource-constrained Robots はコメントを受け付けていません

Mixed Reality Outperforms Virtual Reality for Remote Error Resolution in Pick-and-Place Tasks

要約

この調査では、倉庫のパッケージングエラーの修正など、リモートエラー解像度タスクのための、複合現実(MR)、仮想現実(VR)、およびカメラストリームインターフェイスのパフォーマンスと使いやすさを評価します。
具体的には、エラーを検出した後にロボットアームが停止し、リモートオペレーターがピックアンドプレイスアクションを介して介入して解決する必要があるシナリオを検討します。
21人の参加者が、各インターフェイスを使用してシミュレートされたピックアンドプレイスタスクを実行しました。
タスク解像度時間、ユーザビリティスコア(SUS)、およびメンタルワークロードスコア(NASA-TLX)の線形混合モデル(LMM)分析により、MRインターフェイスがVRインターフェイスとカメラインターフェイスの両方を上回ることが示されました。
MRは、タスクの完了を大幅に高速化し、使いやすさがより高く評価され、認知的に要求が少ないと認識されていました。
特に、仮想ロボットを物理テーブルに投影したMRインターフェイスは、優れた空間的理解と物理的参照キューを提供しました。
研究後の調査により、他のインターフェイスよりもMRに対する参加者の好みがさらに確認されました。

要約(オリジナル)

This study evaluates the performance and usability of Mixed Reality (MR), Virtual Reality (VR), and camera stream interfaces for remote error resolution tasks, such as correcting warehouse packaging errors. Specifically, we consider a scenario where a robotic arm halts after detecting an error, requiring a remote operator to intervene and resolve it via pick-and-place actions. Twenty-one participants performed simulated pick-and-place tasks using each interface. A linear mixed model (LMM) analysis of task resolution time, usability scores (SUS), and mental workload scores (NASA-TLX) showed that the MR interface outperformed both VR and camera interfaces. MR enabled significantly faster task completion, was rated higher in usability, and was perceived to be less cognitively demanding. Notably, the MR interface, which projected a virtual robot onto a physical table, provided superior spatial understanding and physical reference cues. Post-study surveys further confirmed participants’ preference for MR over other interfaces.

arxiv情報

著者 Advay Kumar,Stephanie Simangunsong,Pamela Carreno-Medrano,Akansel Cosgun
発行日 2025-02-10 04:11:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.RO | Mixed Reality Outperforms Virtual Reality for Remote Error Resolution in Pick-and-Place Tasks はコメントを受け付けていません

Reward-Based Collision-Free Algorithm for Trajectory Planning of Autonomous Robots

要約

このペーパーでは、事前定義されたセットからの最適なウェイポイントシーケンスの報酬ベースの選択を可能にする自律ロボットの新しいミッション計画アルゴリズムを紹介します。
アルゴリズムは、ロボットが障害物を避けながらウェイポイント間をナビゲートするための実行可能な軌跡と対応する制御入力を計算し、総報酬を最大化し、状態、入力とその導関数、ミッション時間ウィンドウ、最大距離の制約に準拠します。
これはまた、一般化された賞品を収集する旅行セールスマンの問題を解決します。
提案されたアルゴリズムは、フィットネス関数とクロスオーバーに基づいてソリューション候補を最適なソリューションに向けて進化させる新しい遺伝的アルゴリズムを採用しています。
フィットネス評価中に、ペナルティ方法は制約を強制し、クロスイド曲線を備えた差動フラットネスプロパティは、実行不可能な軌跡を効率的にペナルティします。
オイラースパイラル法は、最小スナップおよびジャークの多項式と比較して、軌道パラメーター化の有望な結果を示しました。
離散探査スペースにより、動的な時間帯ベースの方法と投影との拡張凸の組み合わせを使用して、クロスオーバーが実行されます。
突然変異ステップは探索を強化します。
結果は、最適なウェイポイントシーケンスを見つけ、制約を満たし、実行不可能なウェイポイントを回避し、高報酬のウェイポイントを優先するアルゴリズムの能力を示しています。
グラウンドビークル、四足動物、および四角形を使用したシミュレーションと実験は、ベンチマークと時間的分析によって補完され、補完されます。

要約(オリジナル)

This paper introduces a new mission planning algorithm for autonomous robots that enables the reward-based selection of an optimal waypoint sequence from a predefined set. The algorithm computes a feasible trajectory and corresponding control inputs for a robot to navigate between waypoints while avoiding obstacles, maximizing the total reward, and adhering to constraints on state, input and its derivatives, mission time window, and maximum distance. This also solves a generalized prize-collecting traveling salesman problem. The proposed algorithm employs a new genetic algorithm that evolves solution candidates toward the optimal solution based on a fitness function and crossover. During fitness evaluation, a penalty method enforces constraints, and the differential flatness property with clothoid curves efficiently penalizes infeasible trajectories. The Euler spiral method showed promising results for trajectory parameterization compared to minimum snap and jerk polynomials. Due to the discrete exploration space, crossover is performed using a dynamic time-warping-based method and extended convex combination with projection. A mutation step enhances exploration. Results demonstrate the algorithm’s ability to find the optimal waypoint sequence, fulfill constraints, avoid infeasible waypoints, and prioritize high-reward ones. Simulations and experiments with a ground vehicle, quadrotor, and quadruped are presented, complemented by benchmarking and a time-complexity analysis.

arxiv情報

著者 Jose D. Hoyos,Tianyu Zhou,Zehui Lu,Shaoshuai Mou
発行日 2025-02-10 04:30:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Reward-Based Collision-Free Algorithm for Trajectory Planning of Autonomous Robots はコメントを受け付けていません

Portable, High-Frequency, and High-Voltage Control Circuits for Untethered Miniature Robots Driven by Dielectric Elastomer Actuators

要約

この作業では、誘電体エラストマーアクチュエータ(DEA)の無装置アプリケーションのための高電圧、高周波制御回路を提案します。
回路基板は、0〜1 kHzの範囲の周波数に適したコンパクトサイズ内で最大1.8 kVの制御電圧に直列に接続された低電圧抵抗成分を活用します。
シングルチャネル制御ボードの重量はわずか2.5 gです。
さまざまな負荷条件と電源で制御回路の性能をテストしました。
この制御回路に基づいて、市販のミニチュア高電圧電力コンバーターとともに、円筒形のDEAによって駆動される無関係のクロールロボットを構築します。
42 gの無溶解したロボットは、15 Hzの駆動周波数でベンチおよびパイプライン内でrawる移動を正常に取得し、同時にオンボードカメラとアンテナを介してリアルタイムのビデオデータを送信しました。
私たちの作業は、低電圧制御電子機器を使用して、DEAの無視された運転を実現するための実用的な方法を提供します。

要約(オリジナル)

In this work, we propose a high-voltage, high-frequency control circuit for the untethered applications of dielectric elastomer actuators (DEAs). The circuit board leverages low-voltage resistive components connected in series to control voltages of up to 1.8 kV within a compact size, suitable for frequencies ranging from 0 to 1 kHz. A single-channel control board weighs only 2.5 g. We tested the performance of the control circuit under different load conditions and power supplies. Based on this control circuit, along with a commercial miniature high-voltage power converter, we construct an untethered crawling robot driven by a cylindrical DEA. The 42-g untethered robots successfully obtained crawling locomotion on a bench and within a pipeline at a driving frequency of 15 Hz, while simultaneously transmitting real-time video data via an onboard camera and antenna. Our work provides a practical way to use low-voltage control electronics to achieve the untethered driving of DEAs, and therefore portable and wearable devices.

arxiv情報

著者 Qi Shao,Xin-Jun Liu,Huichan Zhao
発行日 2025-02-10 05:33:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Portable, High-Frequency, and High-Voltage Control Circuits for Untethered Miniature Robots Driven by Dielectric Elastomer Actuators はコメントを受け付けていません

Generalizing Safety Beyond Collision-Avoidance via Latent-Space Reachability Analysis

要約

Hamilton-Jacobi(HJ)Reachabilityは、ロボットが危険な状態を同時に検出し、将来の障害を防ぐアクションを生成できるようにする厳格な数学的枠組みです。
理論的には、HJの到達可能性は、非線形システムと非コンベックス制約の安全なコントローラーを合成することができますが、実際には、低次元の状態空間表現と第一派のダイナミクスを介してモデル化された手工学の衝突回避制約に限定されています。
この作業では、私たちの目標は、安全なロボットコントローラーを一般化して、不可能ではないにしても、手作業で書き留めるのを防ぐために、高次元の観測から直感的に識別できることです。たとえば、の内容をこぼすことです。
バッグ。
潜在的な安全フィルターは、ジェネレーティブワールドモデルの潜在的な埋め込み空間で安全分析を実行することにより、生の観測データ(たとえば、RGB画像)に直接作用するHJリーチ性の潜在スペースの一般化であることを提案します。
これにより、微妙な制約仕様が潜在空間の分類問題に変換され、シミュレートが難しい動的な結果について推論することができます。
シミュレーションおよびハードウェアの実験では、潜在的な安全フィルターを使用して、フランカの研究3マニピュレーターがバッグの内容をこぼしたり、乱雑なオブジェクトを散布するのを防ぐなど、複雑な安全上の危険からarbitrary意的なポリシー(生成ポリシーから遠隔術まで)を保護します。

要約(オリジナル)

Hamilton-Jacobi (HJ) reachability is a rigorous mathematical framework that enables robots to simultaneously detect unsafe states and generate actions that prevent future failures. While in theory, HJ reachability can synthesize safe controllers for nonlinear systems and nonconvex constraints, in practice, it has been limited to hand-engineered collision-avoidance constraints modeled via low-dimensional state-space representations and first-principles dynamics. In this work, our goal is to generalize safe robot controllers to prevent failures that are hard — if not impossible — to write down by hand, but can be intuitively identified from high-dimensional observations: for example, spilling the contents of a bag. We propose Latent Safety Filters, a latent-space generalization of HJ reachability that tractably operates directly on raw observation data (e.g., RGB images) by performing safety analysis in the latent embedding space of a generative world model. This transforms nuanced constraint specification to a classification problem in latent space and enables reasoning about dynamical consequences that are hard to simulate. In simulation and hardware experiments, we use Latent Safety Filters to safeguard arbitrary policies (from generative policies to direct teleoperation) from complex safety hazards, like preventing a Franka Research 3 manipulator from spilling the contents of a bag or toppling cluttered objects.

arxiv情報

著者 Kensuke Nakamura,Lasse Peters,Andrea Bajcsy
発行日 2025-02-10 05:37:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | Generalizing Safety Beyond Collision-Avoidance via Latent-Space Reachability Analysis はコメントを受け付けていません

VL-Nav: Real-time Vision-Language Navigation with Spatial Reasoning

要約

未知の環境でのビジョン言語ナビゲーションは、モバイルロボットにとって重要です。
家庭の支援や救助などのシナリオでは、モバイルロボットは「黒を着ている人を見つける」などの人間の指揮を理解する必要があります。
低電力ロボットに効率的な空間推論を統合する新しいVision-Language Navigation(VL-NAV)システムを提示します。
単一の画像レベルの特徴に依存してロボットを導く以前の方法とは異なり、この方法は、ピクセルごとのビジョン言語機能と好奇心駆動型の探索を統合します。
このアプローチにより、多様な環境にわたる人間にインストールされたインスタンスへの堅牢なナビゲーションが可能になります。
4輪モバイルロボットにVL-NAVを展開し、さまざまなスケールとセマンティックな複雑さにまたがる屋内および屋外の両方の環境で包括的なナビゲーションタスクを通じてパフォーマンスを評価します。
驚くべきことに、VL-NAVは、Jetson Orin NXを使用して30 Hzのリアルタイム周波数で動作し、効率的なビジョン言語ナビゲーションを実施する能力を強調しています。
結果は、VL-NAVが86.3%の全体的な成功率を達成し、以前の方法を44.15%上回ることを示しています。

要約(オリジナル)

Vision-language navigation in unknown environments is crucial for mobile robots. In scenarios such as household assistance and rescue, mobile robots need to understand a human command, such as ‘find a person wearing black’. We present a novel vision-language navigation (VL-Nav) system that integrates efficient spatial reasoning on low-power robots. Unlike prior methods that rely on a single image-level feature similarity to guide a robot, our method integrates pixel-wise vision-language features with curiosity-driven exploration. This approach enables robust navigation to human-instructed instances across diverse environments. We deploy VL-Nav on a four-wheel mobile robot and evaluate its performance through comprehensive navigation tasks in both indoor and outdoor environments, spanning different scales and semantic complexities. Remarkably, VL-Nav operates at a real-time frequency of 30 Hz with a Jetson Orin NX, highlighting its ability to conduct efficient vision-language navigation. Results show that VL-Nav achieves an overall success rate of 86.3%, outperforming previous methods by 44.15%.

arxiv情報

著者 Yi Du,Taimeng Fu,Zhuoqun Chen,Bowen Li,Shaoshu Su,Zhipeng Zhao,Chen Wang
発行日 2025-02-10 06:05:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | VL-Nav: Real-time Vision-Language Navigation with Spatial Reasoning はコメントを受け付けていません

Multi-query Robotic Manipulator Task Sequencing with Gromov-Hausdorff Approximations

要約

ロボットマニピュレーターアプリケーションは、多くの場合、効率的なオンラインモーション計画が必要です。
複数のタスクを完了するとき、シーケンスの順序と目標構成の選択は、計画パフォーマンスに劇的な影響を与える可能性があります。
これは、ロボットタスクシーケンス問題(RTSP)としてよく知られています。
既存の汎用RTSPアルゴリズムは、品質の低いソリューションを生成したり、利用可能な計算時間が制限されている場合に完全に障害を生成したりする可能性があります。
静的障害と非静的障害の組み合わせで、半構造化環境で動作するように設計された新しいマルチクエリタスクシーケンスメソッドを提案します。
私たちの方法は、計画効率のためにワークスペースの一般性を意図的に交換します。
静的な障害物を備えたユーザー定義のタスクスペースを考えると、サブスペース分解を計算します。
重要なアイデアは、タスクと構成空間の両方で互いに近いポイントを識別する$ \ epsilon $ -gromov-hausdorff近似として知られる近似イソメトリを確立することです。
重要なことに、これらの部分空間内のパスの長さにおける境界のあるサブオプティマリティ保証が証明されています。
これらの境界関係はさらに、同じ部分空間内の経路をスムーズに連結できることを意味します。これは、効率的なタスクシーケンスを決定するのに役立つことを示しています。
複雑なシミュレートされた環境でいくつかの運動学的構成で私たちの方法を評価し、ベースラインと比較して最大3倍のモーションプランニングと5倍低い最大軌道ジャークを達成します。

要約(オリジナル)

Robotic manipulator applications often require efficient online motion planning. When completing multiple tasks, sequence order and choice of goal configuration can have a drastic impact on planning performance. This is well known as the robot task sequencing problem (RTSP). Existing general-purpose RTSP algorithms are susceptible to producing poor-quality solutions or failing entirely when available computation time is restricted. We propose a new multi-query task sequencing method designed to operate in semi-structured environments with a combination of static and non-static obstacles. Our method intentionally trades off workspace generality for planning efficiency. Given a user-defined task space with static obstacles, we compute a subspace decomposition. The key idea is to establish approximate isometries known as $\epsilon$-Gromov-Hausdorff approximations that identify points that are close to one another in both task and configuration space. Importantly, we prove bounded suboptimality guarantees on the lengths of paths within these subspaces. These bounding relations further imply that paths within the same subspace can be smoothly concatenated, which we show is useful for determining efficient task sequences. We evaluate our method with several kinematic configurations in a complex simulated environment, achieving up to 3x faster motion planning and 5x lower maximum trajectory jerk compared to baselines.

arxiv情報

著者 Fouad Sukkar,Jennifer Wakulicz,Ki Myung Brian Lee,Weiming Zhi,Robert Fitch
発行日 2025-02-10 06:06:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Multi-query Robotic Manipulator Task Sequencing with Gromov-Hausdorff Approximations はコメントを受け付けていません