Uncertainty-aware Latent Safety Filters for Avoiding Out-of-Distribution Failures

要約

最近の生成的ワールドモデルの進歩により、ハミルトン-ヤコビ(HJ)到達可能性のような古典的な安全制御手法を、高次元のセンサ観測から直接動作する複雑なロボットシステムに一般化することが可能になった。しかし、ワールドモデルの学習において、全てのセーフティクリティカルなシナリオを包括的にカバーすることは非常に困難である。その結果、これらのモデルの上に構築された潜在的な安全フィルタは、新しいハザードを見落としたり、既知のハザードを防げなかったりする可能性がある。この問題に対処するため、我々は不確実性を考慮した潜在的安全フィルタを導入し、既知および未知の故障からロボットを積極的に遠ざける。我々の重要なアイデアは、世界モデルの認識論的不確実性を、目に見えない潜在的危険を特定するための代理として利用することである。我々は、適合予測を介して不確実性の閾値を較正することにより、OODワールドモデルの予測を検出する原理的な方法を提案する。潜在的表現と認識論的不確実性の両方にまたがる拡張された状態空間において到達可能性分析を行うことにより、既知および未知の安全ハザードの両方から任意のポリシーを確実に保護できる潜在的安全フィルタを合成する。Frankaマニピュレータを用いた視覚ベースの制御タスクに関するシミュレーションとハードウェア実験において、我々の不確実性を考慮した安全フィルタが潜在的な安全でないシナリオを先取りして検出し、安全な分配内アクションを確実に提案することを示す。ビデオの結果は、プロジェクトのウェブサイト https://cmu-intentlab.github.io/UNISafe で見ることができます。

要約(オリジナル)

Recent advances in generative world models have enabled classical safe control methods, such as Hamilton-Jacobi (HJ) reachability, to generalize to complex robotic systems operating directly from high-dimensional sensor observations. However, obtaining comprehensive coverage of all safety-critical scenarios during world model training is extremely challenging. As a result, latent safety filters built on top of these models may miss novel hazards and even fail to prevent known ones, overconfidently misclassifying risky out-of-distribution (OOD) situations as safe. To address this, we introduce an uncertainty-aware latent safety filter that proactively steers robots away from both known and unseen failures. Our key idea is to use the world model’s epistemic uncertainty as a proxy for identifying unseen potential hazards. We propose a principled method to detect OOD world model predictions by calibrating an uncertainty threshold via conformal prediction. By performing reachability analysis in an augmented state space-spanning both the latent representation and the epistemic uncertainty-we synthesize a latent safety filter that can reliably safeguard arbitrary policies from both known and unseen safety hazards. In simulation and hardware experiments on vision-based control tasks with a Franka manipulator, we show that our uncertainty-aware safety filter preemptively detects potential unsafe scenarios and reliably proposes safe, in-distribution actions. Video results can be found on the project website at https://cmu-intentlab.github.io/UNISafe

arxiv情報

著者 Junwon Seo,Kensuke Nakamura,Andrea Bajcsy
発行日 2025-05-01 18:18:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | Uncertainty-aware Latent Safety Filters for Avoiding Out-of-Distribution Failures はコメントを受け付けていません

Reconfigurable legged metamachines that run on autonomous modular legs

要約

脚を持つ機械はますます機敏になり、適応力も高まっているが、これまでのところ、脚を持つ動物のような基本的な再構成能力はない。生物学的な対応物とは異なり、脚を持つ機械は過去10年間で、新しいタスクに対応したり怪我から回復したりするために簡単に再構成できない、定型的な四足歩行や二足歩行の構造にほぼ収束してきた。これは、機敏でありながら最小限の1自由度の関節リンクであり、複雑な動的挙動を学習することができ、自由に取り付けてメートル単位の脚式メタマシンを形成することができる。これにより、非構造的な環境を素早くアクロバティックに(非定常的に)移動する、高度にダイナミックなモジュール型エージェントの迅速な修復、再設計、組み換えが可能になる。各モジュールはそれ自体が完全なエージェントであるため、脚式メタマシンは、他の脚式ロボットでは完全に機能しなくなるような深い構造的損傷にも耐えることができる。また、我々は、可能な身体構成の膨大な空間を、効率的に探索できるコンパクトな潜在デザインゲノムに符号化する方法を示し、新規な脚形態の多様性を明らかにする。

要約(オリジナル)

Legged machines are becoming increasingly agile and adaptive but they have so far lacked the basic reconfigurability of legged animals, which have been rearranged and reshaped to fill millions of niches. Unlike their biological counterparts, legged machines have largely converged over the past decade to canonical quadrupedal and bipedal architectures that cannot be easily reconfigured to meet new tasks or recover from injury. Here we introduce autonomous modular legs: agile yet minimal, single-degree-of-freedom jointed links that can learn complex dynamic behaviors and may be freely attached to form legged metamachines at the meter scale. This enables rapid repair, redesign, and recombination of highly-dynamic modular agents that move quickly and acrobatically (non-quasistatically) through unstructured environments. Because each module is itself a complete agent, legged metamachines are able to sustain deep structural damage that would completely disable other legged robots. We also show how to encode the vast space of possible body configurations into a compact latent design genome that can be efficiently explored, revealing a wide diversity of novel legged forms.

arxiv情報

著者 Chen Yu,David Matthews,Jingxian Wang,Jing Gu,Douglas Blackiston,Michael Rubenstein,Sam Kriegman
発行日 2025-05-01 18:28:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO | Reconfigurable legged metamachines that run on autonomous modular legs はコメントを受け付けていません

Improved Approximation of Sensor Network Performance for Seabed Acoustic Sensors

要約

ポアソン分布するターゲットを検出するためのセンサ位置、例えば船舶の往来を検出する海底センサは、すべてのターゲットを検出する確率である、いわゆるボイド確率を最大にするように選択することができる。ボイド確率の評価には計算コストがかかるため、センサネットワークの位置選定の計算コストを大幅に削減できる、ボイド確率の新しい近似を提案する。我々は、ジェンセンの不等式を用いてボイド確率を近似する先行研究を基礎としている。我々の新しいアプローチは、(ポアソン)ターゲットモデルにおける不確実性をより良く収容し、より鋭い誤差境界をもたらす。提案手法をバージニア州ハンプトンロード水路の過去の船舶交通データを用いて評価し、従来の手法と比較して近似誤差が減少することを実証した。この結果は、海上監視アプリケーションにおける改良された近似の有効性を検証するものである。

要約(オリジナル)

Sensor locations to detect Poisson-distributed targets, such as seabed sensors that detect shipping traffic, can be selected to maximize the so-called void probability, which is the probability of detecting all targets. Because evaluation of void probability is computationally expensive, we propose a new approximation of void probability that can greatly reduce the computational cost of selecting locations for a network of sensors. We build upon prior work that approximates void probability using Jensen’s inequality. Our new approach better accommodates uncertainty in the (Poisson) target model and yields a sharper error bound. The proposed method is evaluated using historical ship traffic data from the Hampton Roads Channel, Virginia, demonstrating a reduction in the approximation error compared to the previous approach. The results validate the effectiveness of the improved approximation for maritime surveillance applications.

arxiv情報

著者 Mingyu Kim,Daniel J. Stilwell,Harun Yetkin,Jorge Jimenez
発行日 2025-05-01 19:05:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.IT, cs.RO, math.IT | Improved Approximation of Sensor Network Performance for Seabed Acoustic Sensors はコメントを受け付けていません

HMCF: A Human-in-the-loop Multi-Robot Collaboration Framework Based on Large Language Models

要約

人工知能(AI)の急速な進歩により、ロボットは複雑なタスクを自律的に実行できるようになり、その精度も高まっている。しかし、マルチロボットシステム(MRS)は、特に災害対応のような大規模な展開に拡張する場合、汎化、異種性、安全性という課題に直面する。従来のアプローチでは汎用性に欠けることが多く、新しいタスクやシナリオに対応するための大規模なエンジニアリングが必要であり、多様なロボットの管理に苦労している。これらの限界を克服するために、我々は大規模言語モデル(LLM)を活用したHuman-in-the-loop Multi-Robot Collaboration Framework(HMCF)を提案する。LLMは多様なタスクとロボットの能力を推論することで適応性を高め、人間の監視は安全性と信頼性を確保し、必要な場合にのみ介入する。我々のフレームワークは、人間の監視、LLMエージェント、異種ロボットをシームレスに統合し、タスクの割り当てと実行を最適化する。各ロボットには、その能力を理解し、タスクを実行可能な命令に変換し、タスクの検証と人間の監視を通じて幻覚を減らすことができるLLMエージェントが装備されている。シミュレーションの結果、我々のフレームワークは最先端のタスク計画手法を凌駕し、4.76%の向上という高いタスク成功率を達成した。実世界でのテストでは、そのロバストなゼロショット汎化機能と、最小限の人間の介入で多様なタスクと環境を扱う能力が実証された。

要約(オリジナル)

Rapid advancements in artificial intelligence (AI) have enabled robots to performcomplex tasks autonomously with increasing precision. However, multi-robot systems (MRSs) face challenges in generalization, heterogeneity, and safety, especially when scaling to large-scale deployments like disaster response. Traditional approaches often lack generalization, requiring extensive engineering for new tasks and scenarios, and struggle with managing diverse robots. To overcome these limitations, we propose a Human-in-the-loop Multi-Robot Collaboration Framework (HMCF) powered by large language models (LLMs). LLMs enhance adaptability by reasoning over diverse tasks and robot capabilities, while human oversight ensures safety and reliability, intervening only when necessary. Our framework seamlessly integrates human oversight, LLM agents, and heterogeneous robots to optimize task allocation and execution. Each robot is equipped with an LLM agent capable of understanding its capabilities, converting tasks into executable instructions, and reducing hallucinations through task verification and human supervision. Simulation results show that our framework outperforms state-of-the-art task planning methods, achieving higher task success rates with an improvement of 4.76%. Real-world tests demonstrate its robust zero-shot generalization feature and ability to handle diverse tasks and environments with minimal human intervention.

arxiv情報

著者 Zhaoxing Li,Wenbo Wu,Yue Wang,Yanran Xu,William Hunt,Sebastian Stein
発行日 2025-05-01 19:23:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO | HMCF: A Human-in-the-loop Multi-Robot Collaboration Framework Based on Large Language Models はコメントを受け付けていません

Near-optimal Sensor Placement for Detecting Stochastic Target Trajectories in Barrier Coverage Systems

要約

本論文では、2次元バリアカバレッジシステムにおけるセンサの配置について述べる。課題は、軌道が対数ガウス型コックス直線過程に従うターゲットを検出するために、最適に近いセンサー配置を計算することである。我々は、線形のターゲット軌道を点として表現する変換空間におけるセンサ配置を探索する。この空間は線過程の取り扱いを単純化する一方で、センサーの性能(すなわち検出確率)を表す空間関数は直感的でなくなる。我々のアプローチを説明するために、バリアカバレッジシステムのセンサーを海底に配置し、通過する船舶を検知することに焦点を当てる。過去の船舶データを用いた数値実験により、バリアカバレッジシステム上を通過する全ての船舶が検知される確率を最大化するセンサー位置を計算する。

要約(オリジナル)

This paper addresses the deployment of sensors for a 2-D barrier coverage system. The challenge is to compute near-optimal sensor placements for detecting targets whose trajectories follow a log-Gaussian Cox line process. We explore sensor deployment in a transformed space, where linear target trajectories are represented as points. While this space simplifies handling the line process, the spatial functions representing sensor performance (i.e. probability of detection) become less intuitive. To illustrate our approach, we focus on positioning sensors of the barrier coverage system on the seafloor to detect passing ships. Through numerical experiments using historical ship data, we compute sensor locations that maximize the probability all ship passing over the barrier coverage system are detected.

arxiv情報

著者 Mingyu Kim,Daniel J. Stilwell,Harun Yetkin,Jorge Jimenez
発行日 2025-05-01 19:31:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO, cs.SY, eess.SY | Near-optimal Sensor Placement for Detecting Stochastic Target Trajectories in Barrier Coverage Systems はコメントを受け付けていません

HEIGHT: Heterogeneous Interaction Graph Transformer for Robot Navigation in Crowded and Constrained Environments

要約

我々は、通路や家具のような環境制約のある、密集したインタラクティブな群衆におけるロボットナビゲーションの問題を研究している。これまでの手法では、エージェントや障害物間のあらゆる種類の相互作用を考慮することができず、安全で非効率なロボット経路を導く。本稿では、混雑と制約のあるシナリオのグラフベースの表現を活用し、深層強化学習を用いてロボットのナビゲーション方針を学習するための構造化フレームワークを提案する。我々はまず、環境中の異なる構成要素の表現を分割し、人間、ロボット、障害物の間の異なる相互作用をモデル化するための異種時空間(st)グラフを提案する。異種stグラフに基づき、我々は、空間と時間を介したエンティティ間の異種相互作用を捉えるために、異なる構成要素を持つ新しいナビゲーションポリシーネットワークアーキテクチャであるHEIGHTを提案する。HEIGHTは、重要な相互作用に優先順位をつけるための注意機構と、動的なシーンの時間的変化を追跡するためのリカレントネットワークを利用し、ロボットが適応的に衝突を回避するように促す。広範なシミュレーションと実世界での実験を通して、HEIGHTが、困難なナビゲーションシナリオにおいて、成功と効率性の点で最先端のベースラインを上回ることを実証する。さらに、我々のパイプラインは、人間や障害物の密度が変化した場合に、従来の作品よりも優れたゼロショット汎化能力を達成することを実証する。その他のビデオはhttps://sites.google.com/view/crowdnav-height/home。

要約(オリジナル)

We study the problem of robot navigation in dense and interactive crowds with environmental constraints such as corridors and furniture. Previous methods fail to consider all types of interactions among agents and obstacles, leading to unsafe and inefficient robot paths. In this article, we leverage a graph-based representation of crowded and constrained scenarios and propose a structured framework to learn robot navigation policies with deep reinforcement learning. We first split the representations of different components in the environment and propose a heterogeneous spatio-temporal (st) graph to model distinct interactions among humans, robots, and obstacles. Based on the heterogeneous st-graph, we propose HEIGHT, a novel navigation policy network architecture with different components to capture heterogeneous interactions among entities through space and time. HEIGHT utilizes attention mechanisms to prioritize important interactions and a recurrent network to track changes in the dynamic scene over time, encouraging the robot to avoid collisions adaptively. Through extensive simulation and real-world experiments, we demonstrate that HEIGHT outperforms state-of-the-art baselines in terms of success and efficiency in challenging navigation scenarios. Furthermore, we demonstrate that our pipeline achieves better zero-shot generalization capability than previous works when the densities of humans and obstacles change. More videos are available at https://sites.google.com/view/crowdnav-height/home.

arxiv情報

著者 Shuijing Liu,Haochen Xia,Fatemeh Cheraghi Pouria,Kaiwen Hong,Neeloy Chakraborty,Zichao Hu,Joydeep Biswas,Katherine Driggs-Campbell
発行日 2025-05-01 20:03:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.LG, cs.RO | HEIGHT: Heterogeneous Interaction Graph Transformer for Robot Navigation in Crowded and Constrained Environments はコメントを受け付けていません

Design and Implementation of a Dual Uncrewed Surface Vessel Platform for Bathymetry Research under High-flow Conditions

要約

海底地形の研究である水深測量は、水中構造物のソナーによるマッピングに依存している。インフラの健全性監視に不可欠なこれらの測定には、高価な計測器が必要になることが多い。センサーの損傷や船舶の喪失に伴う金銭的リスクが高いため、水深測量のために乗組員なしの水上船舶(USV)を配備することには消極的である。しかし、乗組員付きのボートによる水深測定作業は、コストが高く、人員に危険をもたらし、特に高潮流下では、水深測定データ収集に必要な安定した条件を達成できないことが多い。特に水深測量に焦点を当てた自律制御、ナビゲーション、データ処理技術を進歩させるためには、さらなる研究が不可欠である。水深測深に焦点を当てた自律制御とナビゲーション、およびデータ評価と処理の両方を統合的に研究できる、アクセス可能なハードウェア・プラットフォームが著しく不足している。本論文では、非乗組員の水深調査用に調整された2つの補完的なUSVシステムの設計と実装を通じて、このギャップに対処する。これには、ナビゲーションと制御研究用の低コストUSV(NAC-USV)と、水深データの品質評価と後処理研究用の高解像度マルチビームソナーと関連ハードウェアを装備した2番目のハイエンドUSV(BEP-USV)が含まれる。NAC-USVは、機器へのリスクを最小限に抑えつつ、高品質の水深データ収集に必要な安定性を重視し、自律的でフェイルセーフな航行と制御の調査を容易にする。NAC-USVのハードウェアを反映したBEP-USVは、さらに制御の検証や、水深測定データの評価と後処理の方法論の詳細な調査に使用されます。両システムの設計と実装を詳述し、設計をオープンソース化する。さらに、さまざまな運用シナリオにおけるシステムの有効性を実証する。

要約(オリジナル)

Bathymetry, the study of underwater topography, relies on sonar mapping of submerged structures. These measurements, critical for infrastructure health monitoring, often require expensive instrumentation. The high financial risk associated with sensor damage or vessel loss creates a reluctance to deploy uncrewed surface vessels (USVs) for bathymetry. However, the crewed-boat bathymetry operations, are costly, pose hazards to personnel, and frequently fail to achieve the stable conditions necessary for bathymetry data collection, especially under high currents. Further research is essential to advance autonomous control, navigation, and data processing technologies, with a particular focus on bathymetry. There is a notable lack of accessible hardware platforms that allow for integrated research in both bathymetry-focused autonomous control and navigation, as well as data evaluation and processing. This paper addresses this gap through the design and implementation of two complementary USV systems tailored for uncrewed bathymetry research. This includes a low-cost USV for Navigation And Control research (NAC-USV) and a second, high-end USV equipped with a high-resolution multi-beam sonar and the associated hardware for Bathymetry data quality Evaluation and Post-processing research (BEP-USV). The NAC-USV facilitates the investigation of autonomous, fail-safe navigation and control, emphasizing the stability requirements for high-quality bathymetry data collection while minimizing the risk to equipment. The BEP-USV, which mirrors the NAC-USV hardware, is then used for additional control validation and in-depth exploration of bathymetry data evaluation and post-processing methodologies. We detail the design and implementation of both systems, and open source the design. Furthermore, we demonstrate the system’s effectiveness in a range of operational scenarios.

arxiv情報

著者 Dinesh Kumar,Amin Ghorbanpour,Kin Yen,Iman Soltani
発行日 2025-05-01 20:07:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | Design and Implementation of a Dual Uncrewed Surface Vessel Platform for Bathymetry Research under High-flow Conditions はコメントを受け付けていません

Fault-Tolerant Multi-Modal Localization of Multi-Robots on Matrix Lie Groups

要約

協調型マルチロボットシステムのナビゲーションにおける一貫したローカライゼーションは、大きな課題である。本論文では、マルチロボットシステムのための、フォールトトレラントでマルチモーダルなローカライゼーションフレームワークを提案する。本論文では、Lie群上の相関・非相関推定値の合成、差分、反転、平均化、融合を行うための新しい確率演算を導入し、フィルタ更新のための擬似ポーズ構築を可能にする。本手法は、拡張カルマンフィルタ(EKF)フレームワークにおいて、各ロボットの慣性、速度、姿勢(擬似姿勢)センサからの固有知覚および外部知覚測定値の組み合わせを統合する。予測ステップは、各ロボットのポーズ、速度、慣性計測のバイアスが伝搬される、$mathbb{SE}_2(3) Ⓐtimes Ⓐmathbb{R}^3$ リー群上で行われる。提案するフレームワークでは、体速度、フィデューシャルマーカーからの相対姿勢計測、およびロボット間通信を用いて、リー群$mathbb{SE}(3) ⊖times ⊖mathbb{R}^3$上のネットワーク全体でスケーラブルなEKF更新を提供する。故障検出モジュールが実装されており、フィデューシャルマーカーからの信頼性の高い擬似ポーズ測定値のみを統合することができる。慣性計測ユニット、車輪オドメトリ、ArUcoマーカーを装備した車輪付き移動ロボットのネットワークを用いた実験により、本手法の有効性を実証する。比較の結果、提案手法のリアルタイム性能、優れた効率性、信頼性、マルチロボット定位におけるスケーラビリティが強調され、大規模ロボットシステムに適していることがわかった。

要約(オリジナル)

Consistent localization of cooperative multi-robot systems during navigation presents substantial challenges. This paper proposes a fault-tolerant, multi-modal localization framework for multi-robot systems on matrix Lie groups. We introduce novel stochastic operations to perform composition, differencing, inversion, averaging, and fusion of correlated and non-correlated estimates on Lie groups, enabling pseudo-pose construction for filter updates. The method integrates a combination of proprioceptive and exteroceptive measurements from inertial, velocity, and pose (pseudo-pose) sensors on each robot in an Extended Kalman Filter (EKF) framework. The prediction step is conducted on the Lie group $\mathbb{SE}_2(3) \times \mathbb{R}^3 \times \mathbb{R}^3$, where each robot’s pose, velocity, and inertial measurement biases are propagated. The proposed framework uses body velocity, relative pose measurements from fiducial markers, and inter-robot communication to provide scalable EKF update across the network on the Lie group $\mathbb{SE}(3) \times \mathbb{R}^3$. A fault detection module is implemented, allowing the integration of only reliable pseudo-pose measurements from fiducial markers. We demonstrate the effectiveness of the method through experiments with a network of wheeled mobile robots equipped with inertial measurement units, wheel odometry, and ArUco markers. The comparison results highlight the proposed method’s real-time performance, superior efficiency, reliability, and scalability in multi-robot localization, making it well-suited for large-scale robotic systems.

arxiv情報

著者 Mahboubeh Zarei,Robin Chhabra
発行日 2025-05-01 20:09:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO, cs.SY, eess.SY, math.GR | Fault-Tolerant Multi-Modal Localization of Multi-Robots on Matrix Lie Groups はコメントを受け付けていません

Leveraging Symmetry to Accelerate Learning of Trajectory Tracking Controllers for Free-Flying Robotic Systems

要約

追跡コントローラは、ロボットシステムが計画された基準軌道を正確に追跡することを可能にする。特に強化学習(RL)は、複雑なダイナミクスを持ち、オンライン計算バジェットが控えめなシステムのコントローラ合成に有望である。しかし、RLはサンプル効率が悪く、報酬設計が難しいため、特に高次元システムでは学習に時間がかかり、時には不安定になる。本研究では、浮動ベースを持つロボットシステムに固有のリー群対称性を活用し、トラッキングコントローラを学習する際のこれらの課題を軽減する。我々は、一般的な追跡問題を、物理状態と参照状態の両方の進化を捉えるマルコフ決定過程(MDP)としてモデル化する。次に、基礎となるダイナミクスとランニングコストにおける対称性が、MDPの同型性、つまり、低次元の「商」MDP上で学習されたポリシーを、元のシステムに対する最適なトラッキングコントローラに持ち上げることを可能にするマッピングにつながることを証明する。我々は、この対称性を考慮したアプローチと、構造化されていないベースラインとを比較し、Proximal Policy Optimization(PPO)を用いて、3つのシステム(Particle(強制点質量)、Astrobee(完全作動宇宙ロボット)、Quadrotor(低作動システム)のトラッキングコントローラを学習する。その結果、対称性を考慮したアプローチにより、学習が加速され、収束時のトラッキングエラーが減少することが示された。

要約(オリジナル)

Tracking controllers enable robotic systems to accurately follow planned reference trajectories. In particular, reinforcement learning (RL) has shown promise in the synthesis of controllers for systems with complex dynamics and modest online compute budgets. However, the poor sample efficiency of RL and the challenges of reward design make training slow and sometimes unstable, especially for high-dimensional systems. In this work, we leverage the inherent Lie group symmetries of robotic systems with a floating base to mitigate these challenges when learning tracking controllers. We model a general tracking problem as a Markov decision process (MDP) that captures the evolution of both the physical and reference states. Next, we prove that symmetry in the underlying dynamics and running costs leads to an MDP homomorphism, a mapping that allows a policy trained on a lower-dimensional ‘quotient’ MDP to be lifted to an optimal tracking controller for the original system. We compare this symmetry-informed approach to an unstructured baseline, using Proximal Policy Optimization (PPO) to learn tracking controllers for three systems: the Particle (a forced point mass), the Astrobee (a fullyactuated space robot), and the Quadrotor (an underactuated system). Results show that a symmetry-aware approach both accelerates training and reduces tracking error at convergence.

arxiv情報

著者 Jake Welde,Nishanth Rao,Pratik Kunapuli,Dinesh Jayaraman,Vijay Kumar
発行日 2025-05-01 20:56:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.RO, cs.SY, eess.SY | Leveraging Symmetry to Accelerate Learning of Trajectory Tracking Controllers for Free-Flying Robotic Systems はコメントを受け付けていません

Caging in Time: A Framework for Robust Object Manipulation under Uncertainties and Limited Robot Perception

要約

実世界での物体操作は、物理的な不確定性や知覚の限界によって、一般的に困難なものとなっている。効果的な戦略として、ケージング構成に基づくマニピュレーションフレームワークはロバストな解決策を提供することに成功しているが、複数のロボットの可用性、広範囲に分散した接触、ロボットや物体の特定の形状などの厳しい要件のため、広く適用できるものではない。 本研究では、これまでのセンサレスマニピュレーションのアイデアと不確実性ハンドリングのアプローチを基に、1台のロボットがタスクに従事している状態でもケージングコンフィギュレーションを形成できるようにする、Caging in Timeと呼ばれる新しいフレームワークを提案する。このコンセプトは、ケージングは物体の動きを拘束する必要がある一方で、ケージの一部だけがいかなる瞬間にも物体と積極的に接触しているという洞察を活用する。このように、エンド・エフェクタの構成を戦略的に切り替え、時間内に折りたたむことで、必要なときに必要な部分がアクティブになるケージを形成する。 我々は、準静的かつ動的な操作タスクに我々のアプローチを適用し、幾何学ベースやエネルギーベースのケージを含む一般的なケージ形成において、時間内ケージ化が実現可能であることを示す。実験により、物体の形状や物理的特性に関する詳細な知識や、操作状態に関するリアルタイムの正確なフィードバックを必要とせず、オープンループでロバストかつ正確な操作が可能であることを示す。効果的でロバストなオープンループ操作ソリューションであることに加え、ケージ・イン・タイムは、ロボットの知覚の不確実性や制限に影響される他の操作システムの補助的な戦略にもなり得る。

要約(オリジナル)

Real-world object manipulation has been commonly challenged by physical uncertainties and perception limitations. Being an effective strategy, while caging configuration-based manipulation frameworks have successfully provided robust solutions, they are not broadly applicable due to their strict requirements on the availability of multiple robots, widely distributed contacts, or specific geometries of robots or objects. Building upon previous sensorless manipulation ideas and uncertainty handling approaches, this work proposes a novel framework termed Caging in Time to allow caging configurations to be formed even with one robot engaged in a task. This concept leverages the insight that while caging requires constraining the object’s motion, only part of the cage actively contacts the object at any moment. As such, by strategically switching the end-effector configuration and collapsing it in time, we form a cage with its necessary portion active whenever needed. We instantiate our approach on challenging quasi-static and dynamic manipulation tasks, showing that Caging in Time can be achieved in general cage formulations including geometry-based and energy-based cages. With extensive experiments, we show robust and accurate manipulation, in an open-loop manner, without requiring detailed knowledge of the object geometry or physical properties, or real-time accurate feedback on the manipulation states. In addition to being an effective and robust open-loop manipulation solution, Caging in Time can be a supplementary strategy to other manipulation systems affected by uncertain or limited robot perception.

arxiv情報

著者 Gaotian Wang,Kejia Ren,Andrew S. Morgan,Kaiyu Hang
発行日 2025-05-01 21:06:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO | Caging in Time: A Framework for Robust Object Manipulation under Uncertainties and Limited Robot Perception はコメントを受け付けていません