LUMOS: Language-Conditioned Imitation Learning with World Models

要約

ロボット工学のための言語条件付きマルチタスク模倣学習フレームワークであるLumosを紹介します。
Lumosは、学んだ世界モデルの潜在的な空間で多くの長距離のロールアウトを練習することでスキルを学び、これらのスキルを実際のロボットにゼロショットに転送します。
学んだ世界モデルの潜在的な空間でポリシーで学習することにより、私たちのアルゴリズムは、ほとんどのオフラインの模倣学習方法に苦しむ政策誘発分布シフトを緩和します。
Lumosは、非構造化されたプレイデータから1%未満の後知恵の言語注釈を学びますが、テスト時に言語コマンドを使用して操縦できます。
トレーニング中に潜在的な計画と画像ベースの後知恵の目標再溶解と組み合わせることと、複数の時間ステップで世界モデルの潜在空間で定義された本質的な報酬を最適化し、共変量シフトを効果的に削減することにより、この一貫した長老のパフォーマンスを達成します。
困難な長老のカルビンベンチマークの実験では、Lumosは、チェーンされたマルチタスク評価で同等のアプローチを備えた以前の学習ベースの方法を上回ります。
私たちの知る限り、私たちは、オフラインの世界モデル内の現実世界のロボットの言語条件付きの連続視力制御を学ぶ最初の人です。
ビデオ、データセット、コードはhttp://lumos.cs.uni-freiburg.deで入手できます。

要約(オリジナル)

We introduce LUMOS, a language-conditioned multi-task imitation learning framework for robotics. LUMOS learns skills by practicing them over many long-horizon rollouts in the latent space of a learned world model and transfers these skills zero-shot to a real robot. By learning on-policy in the latent space of the learned world model, our algorithm mitigates policy-induced distribution shift which most offline imitation learning methods suffer from. LUMOS learns from unstructured play data with fewer than 1% hindsight language annotations but is steerable with language commands at test time. We achieve this coherent long-horizon performance by combining latent planning with both image- and language-based hindsight goal relabeling during training, and by optimizing an intrinsic reward defined in the latent space of the world model over multiple time steps, effectively reducing covariate shift. In experiments on the difficult long-horizon CALVIN benchmark, LUMOS outperforms prior learning-based methods with comparable approaches on chained multi-task evaluations. To the best of our knowledge, we are the first to learn a language-conditioned continuous visuomotor control for a real-world robot within an offline world model. Videos, dataset and code are available at http://lumos.cs.uni-freiburg.de.

arxiv情報

著者 Iman Nematollahi,Branton DeMoss,Akshay L Chandra,Nick Hawes,Wolfram Burgard,Ingmar Posner
発行日 2025-03-13 13:48:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.RO | LUMOS: Language-Conditioned Imitation Learning with World Models はコメントを受け付けていません

Compliant Control of Quadruped Robots for Assistive Load Carrying

要約

このペーパーでは、四足ロボットを使用した支援負荷運搬の新しい方法を紹介します。
コントローラーは、固有受容センサーデータを使用して外部ベースレンチを推定します。これは、ペイロード輸送中のロボットの加速を正確に制御するために使用されます。
加速度は、アドミタンス制御および制御バリア関数(CBF)ベースの二次プログラム(QP)の組み合わせを使用して制御されます。
提案されたコントローラーは、障害を拒否し、さまざまな負荷条件下で一貫したパフォーマンスを維持します。
さらに、組み込みのCBFは、ロボットの前の共同エージェントとの衝突回避を保証します。
コントローラー全体の有効性は、物理ハードウェアに実装されたものと数値シミュレーションによって示されます。
提案された制御フレームワークは、産業用アプリケーションから捜索および救助活動まで、さまざまなシナリオで支援タスクを実行する四足ロボットの能力を強化することを目的としています。

要約(オリジナル)

This paper presents a novel method for assistive load carrying using quadruped robots. The controller uses proprioceptive sensor data to estimate external base wrench, that is used for precise control of the robot’s acceleration during payload transport. The acceleration is controlled using a combination of admittance control and Control Barrier Function (CBF) based quadratic program (QP). The proposed controller rejects disturbances and maintains consistent performance under varying load conditions. Additionally, the built-in CBF guarantees collision avoidance with the collaborative agent in front of the robot. The efficacy of the overall controller is shown by its implementation on the physical hardware as well as numerical simulations. The proposed control framework aims to enhance the quadruped robot’s ability to perform assistive tasks in various scenarios, from industrial applications to search and rescue operations.

arxiv情報

著者 Nimesh Khandelwal,Amritanshu Manu,Shakti S. Gupta,Mangal Kothari,Prashanth Krishnamurthy,Farshad Khorrami
発行日 2025-03-13 14:25:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Compliant Control of Quadruped Robots for Assistive Load Carrying はコメントを受け付けていません

A nonlinear real time capable motion cueing algorithm based on deep reinforcement learning

要約

モーションシミュレーションでは、モーションキューイングアルゴリズムがモーションシミュレータープラットフォームの軌跡計画に使用されます。ここでは、ワークスペースの制限により、参照軌跡の直接的な再現が妨げられます。
これらの設定では、プラットフォームを中心に戻すモーションウォッシュアウトなどの戦略が重要です。
高度に非線形のワークスペースを備えたシリアルロボットMSPの場合、MSPSキネマティックおよびダイナミック機能の効率的な利用を最大化することが不可欠です。
古典的なウォッシュアウトフィルタリングや線形モデル予測制御を含む従来のアプローチは、プラットフォーム固有の非線形特性を考慮していませんが、非線形モデル予測制御は、包括的ではありますが、さらなる単純化なしにリアルタイムのパイロットアプリケーションを妨げる高い計算要求を課します。
これらの制限を克服するために、MSPS運動の非線形性を完全に考慮して、6度のフリードーム設定で初めてここで実証されたモーションキューイングの深い補強学習を使用して、新しいアプローチを導入します。
著者による以前の研究では、運動学的または動的な制約を考慮していない単純化された2-DOFセットアップへのDRLの適用を成功裏に実証しました。
このアプローチは、MSPの完全な運動学モデルをアルゴリズムに組み込むことにより、6 DOFすべてに拡張されました。これは、実際のモーションシミュレーターでアプリケーションを有効にするための重要なステップです。
DRL-MCAのトレーニングは、自動化されたハイパーパラメーターの最適化と組み合わせた、アクタークリティックの実装における近位政策最適化に基づいています。
必要なトレーニングフレームワークとアルゴリズム自体を詳述した後、包括的な検証を提供し、DRL MCAが確立されたアルゴリズムに対して競争力のあるパフォーマンスを達成することを実証します。
さらに、すべてのシステムの制約を尊重することにより、実行可能な軌跡を生成し、低いものですべてのリアルタイムの要件を満たしています…

要約(オリジナル)

In motion simulation, motion cueing algorithms are used for the trajectory planning of the motion simulator platform, where workspace limitations prevent direct reproduction of reference trajectories. Strategies such as motion washout, which return the platform to its center, are crucial in these settings. For serial robotic MSPs with highly nonlinear workspaces, it is essential to maximize the efficient utilization of the MSPs kinematic and dynamic capabilities. Traditional approaches, including classical washout filtering and linear model predictive control, fail to consider platform-specific, nonlinear properties, while nonlinear model predictive control, though comprehensive, imposes high computational demands that hinder real-time, pilot-in-the-loop application without further simplification. To overcome these limitations, we introduce a novel approach using deep reinforcement learning for motion cueing, demonstrated here for the first time in a 6-degree-of-freedom setting with full consideration of the MSPs kinematic nonlinearities. Previous work by the authors successfully demonstrated the application of DRL to a simplified 2-DOF setup, which did not consider kinematic or dynamic constraints. This approach has been extended to all 6 DOF by incorporating a complete kinematic model of the MSP into the algorithm, a crucial step for enabling its application on a real motion simulator. The training of the DRL-MCA is based on Proximal Policy Optimization in an actor-critic implementation combined with an automated hyperparameter optimization. After detailing the necessary training framework and the algorithm itself, we provide a comprehensive validation, demonstrating that the DRL MCA achieves competitive performance against established algorithms. Moreover, it generates feasible trajectories by respecting all system constraints and meets all real-time requirements with low…

arxiv情報

著者 Hendrik Scheidel,Camilo Gonzalez,Houshyar Asadi,Tobias Bellmann,Andreas Seefried,Shady Mohamed,Saeid Nahavandi
発行日 2025-03-13 14:39:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | A nonlinear real time capable motion cueing algorithm based on deep reinforcement learning はコメントを受け付けていません

Finetuning Generative Trajectory Model with Reinforcement Learning from Human Feedback

要約

動的環境での自律運転には、人間のような適応軌道を生成することが不可欠です。
生成モデルは、実行可能な軌跡を合成することに有望を示していますが、データセットバイアスと分布シフトにより、人間の運転スタイルの微妙な変動性をキャプチャできないことがよくあります。
これに対処するために、モーションプランニングを多様な運転選好に合わせて設計された、生成軌道モデルの人間のフィードバック駆動型の微調整フレームワークであるTrajHFを紹介します。
Trajhfは、従来の模倣学習を超えてマルチモーダルの軌跡の生成を改良するために、人間のフィードバックでマルチコンディショナル脱類と補強学習を組み込みます。
これにより、安全性と実現可能性の制約を維持しながら、人間の運転の好みとのより良い整合性が可能になります。
TrajHFは、NAVSIMベンチマークで93.95のPDMSを達成し、他の方法を大幅に超えています。
Trajhfは、自律運転におけるパーソナライズされた適応性のある軌跡生成のための新しいパラダイムを設定します。

要約(オリジナル)

Generating human-like and adaptive trajectories is essential for autonomous driving in dynamic environments. While generative models have shown promise in synthesizing feasible trajectories, they often fail to capture the nuanced variability of human driving styles due to dataset biases and distributional shifts. To address this, we introduce TrajHF, a human feedback-driven finetuning framework for generative trajectory models, designed to align motion planning with diverse driving preferences. TrajHF incorporates multi-conditional denoiser and reinforcement learning with human feedback to refine multi-modal trajectory generation beyond conventional imitation learning. This enables better alignment with human driving preferences while maintaining safety and feasibility constraints. TrajHF achieves PDMS of 93.95 on NavSim benchmark, significantly exceeding other methods. TrajHF sets a new paradigm for personalized and adaptable trajectory generation in autonomous driving.

arxiv情報

著者 Derun Li,Jianwei Ren,Yue Wang,Xin Wen,Pengxiang Li,Leimeng Xu,Kun Zhan,Zhongpu Xia,Peng Jia,Xianpeng Lang,Ningyi Xu,Hang Zhao
発行日 2025-03-13 14:56:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.RO | Finetuning Generative Trajectory Model with Reinforcement Learning from Human Feedback はコメントを受け付けていません

Maintaining Strong $r$-Robustness in Reconfigurable Multi-Robot Networks using Control Barrier Functions

要約

リーダーフォロワーのコンセンサスでは、コミュニケーショングラフの強力な$ r $ robustnessは、フォロワーが不正行為エージェントの存在下でコンセンサスを達成するのに十分な条件を提供します。
以前の研究では、ロボットが既知の堅牢性特性を持つ所定のネットワークトポロジを形成および/または切り替えることができると想定しています。
ただし、距離ベースの通信モデルを備えたロボットは、目標を完了するために、狭い廊下などの空間的に制約された環境を移動しながら、これらのトポロジを達成できない場合があります。
このホワイトペーパーでは、ロボットが固定トポロジを維持せずに特定のしきい値を超えて、通信グラフの強力な$ r $ robust性を保証するコントロールバリア関数(CBF)を紹介します。
当社のCBFは堅牢性に直接対処し、ロボットが目標を達成するためにナビゲートしながら、柔軟な再構成可能なネットワーク構造を持つことができます。
この方法の有効性は、さまざまなシミュレーションおよびハードウェア実験を通じてテストされます。

要約(オリジナル)

In leader-follower consensus, strong $r$-robustness of the communication graph provides a sufficient condition for followers to achieve consensus in the presence of misbehaving agents. Previous studies have assumed that robots can form and/or switch between predetermined network topologies with known robustness properties. However, robots with distance-based communication models may not be able to achieve these topologies while moving through spatially constrained environments, such as narrow corridors, to complete their objectives. This paper introduces a Control Barrier Function (CBF) that ensures robots maintain strong $r$-robustness of their communication graph above a certain threshold without maintaining any fixed topologies. Our CBF directly addresses robustness, allowing robots to have flexible reconfigurable network structure while navigating to achieve their objectives. The efficacy of our method is tested through various simulation and hardware experiments.

arxiv情報

著者 Haejoon Lee,Dimitra Panagou
発行日 2025-03-13 15:18:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Maintaining Strong $r$-Robustness in Reconfigurable Multi-Robot Networks using Control Barrier Functions はコメントを受け付けていません

Stratified Topological Autonomy for Long-Range Coordination (STALC)

要約

複雑な環境で統一されたマルチロボット調整とモーション計画を達成することは、困難な問題です。
この論文では、長距離調整に対する階層的なアプローチを提示します。これは、長距離調整(STALC)のための層別トポロジー自律性と呼ばれます。
特に、オブザーバーへの可視性を最小限に抑え、危険な環境をナビゲートするマルチロボットチームで安全性を最大化する問題を検討します。
そのアプローチは、そのアプローチが動的なトポロジグラフの概念に依存しています。このグラフの重みは、グラフ内のロボットの位置に基づいて動的に変化します。
この動的なトポロジグラフを作成するために、ロボットチームの個別のオブザーバーの位置(敵対的で友好的な両方のセット)からの可視性を評価し、エッジの重みが敵の位置とロボットチームの構成の両方に依存するトポロジグラフを作成します。
次に、ロボットチームの状態に基づいてこれらのエッジウェイトの進化に時間的制約を課し、混合整数プログラミング(MIP)を使用して、グラフを通じて最適なマルチロボット計画を生成します。
視認性情報は、ロボットのチームの環境を最小限に抑える可視性パスを最小限に抑えるために、自律スタックの下層にも通知します。
私たちのアプローチは、共通の目標を達成するためにチーム全体で対話および調整するロボットのチームの計算の複雑さを減らす方法を提示します。
森林環境と都市環境でのシミュレートされたハードウェア実験でのアプローチを実証します。

要約(オリジナル)

Achieving unified multi-robot coordination and motion planning in complex environments is a challenging problem. In this paper, we present a hierarchical approach to long-range coordination, which we call Stratified Topological Autonomy for Long-Range Coordination (STALC). In particular, we look at the problem of minimizing visibility to observers and maximizing safety with a multi-robot team navigating through a hazardous environment. At its core, our approach relies on the notion of a dynamic topological graph, where the edge weights vary dynamically based on the locations of the robots in the graph. To create this dynamic topological graph, we evaluate the visibility of the robot team from a discrete set of observer locations (both adversarial and friendly), and construct a topological graph whose edge weights depend on both adversary position and robot team configuration. We then impose temporal constraints on the evolution of those edge weights based on robot team state and use Mixed-Integer Programming (MIP) to generate optimal multirobot plans through the graph. The visibility information also informs the lower layers of the autonomy stack to plan minimal visibility paths through the environment for the team of robots. Our approach presents methods to reduce the computational complexity for a team of robots that interact and coordinate across the team to accomplish a common goal. We demonstrate our approach in simulated and hardware experiments in forested and urban environments.

arxiv情報

著者 Cora A. Dimmig,Adam Goertz,Adam Polevoy,Mark Gonzales,Kevin C. Wolfe,Bradley Woosley,John Rogers,Joseph Moore
発行日 2025-03-13 15:45:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Stratified Topological Autonomy for Long-Range Coordination (STALC) はコメントを受け付けていません

Learning Robotic Policy with Imagined Transition: Mitigating the Trade-off between Robustness and Optimality

要約

既存の四足動物の移動学習パラダイムは通常、SIM2realギャップを緩和し、堅牢性を高めるために、広範なドメインのランダム化に依存しています。
不確実性の下で確実に実行するために、幅広い環境パラメーターとセンサーノイズでポリシーを訓練します。
ただし、理想的な条件下で最適なパフォーマンスは、最悪のシナリオを処理する必要性と矛盾することが多いため、最適性と堅牢性の間にトレードオフがあります。
このトレードオフは、理想的なパフォーマンスを犠牲にする過度に保守的な行動につながる、理想的なものの効率性と精度よりも多様で挑戦的な条件の安定性を優先することを学んだ政策を強制します。
この論文では、ポリシー学習を想像上の移行と統合することにより、このトレードオフを軽減する2段階のフレームワークを提案します。
このフレームワークは、想像上の遷移を実証的な入力として組み込むことにより、従来の強化学習(RL)アプローチを強化します。
これらの想像された移行は、理想的な設定内で動作する最適なポリシーとダイナミクスモデルから派生しています。
我々の調査結果は、このアプローチが既存のRLアルゴリズムのドメインランダム化誘発性の悪影響を大幅に軽減することを示しています。
トレーニングの加速、分布内の追跡エラーの減少、および分布外の堅牢性の向上につながります。

要約(オリジナル)

Existing quadrupedal locomotion learning paradigms usually rely on extensive domain randomization to alleviate the sim2real gap and enhance robustness. It trains policies with a wide range of environment parameters and sensor noises to perform reliably under uncertainty. However, since optimal performance under ideal conditions often conflicts with the need to handle worst-case scenarios, there is a trade-off between optimality and robustness. This trade-off forces the learned policy to prioritize stability in diverse and challenging conditions over efficiency and accuracy in ideal ones, leading to overly conservative behaviors that sacrifice peak performance. In this paper, we propose a two-stage framework that mitigates this trade-off by integrating policy learning with imagined transitions. This framework enhances the conventional reinforcement learning (RL) approach by incorporating imagined transitions as demonstrative inputs. These imagined transitions are derived from an optimal policy and a dynamics model operating within an idealized setting. Our findings indicate that this approach significantly mitigates the domain randomization-induced negative impact of existing RL algorithms. It leads to accelerated training, reduced tracking errors within the distribution, and enhanced robustness outside the distribution.

arxiv情報

著者 Wei Xiao,Shangke Lyu,Zhefei Gong,Renjie Wang,Donglin Wang
発行日 2025-03-13 15:52:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Learning Robotic Policy with Imagined Transition: Mitigating the Trade-off between Robustness and Optimality はコメントを受け付けていません

Versatile Demonstration Interface: Toward More Flexible Robot Demonstration Collection

要約

デモンストレーションから学ぶための以前の方法は、人間がテレオ操作、運動感覚的教育、自然なデモなど、ロボットに動きを教えるためのいくつかのアプローチを活用しています。
ただし、以前の作業では、複数のデモンストレーションタイプを可能にするより一般的なインターフェイスを調査していません。
人間のデモ参加者とタスクの特性のさまざまな好みを考えると、複数のデモンストレーションタイプを可能にする柔軟なツールは、より広範なロボットスキルトレーニングに重要になる可能性があります。
この作業では、3つの一般的なタイプのデモンストレーションのコレクションを簡素化する共同ロボットの添付ファイルである汎用性の高いデモンストレーションインターフェイス(VDI)を提案します。
産業環境での柔軟な展開のために設計されたこのツールは、環境の追加の計装を必要としません。
私たちのプロトタイプインターフェイスは、視力、力のセンシング、状態追跡の組み合わせ(例えば、ロボットの固有受容またはアプリタグ追跡)を介して人間のデモンストレーションをキャプチャします。
製造業の専門家と一緒に地元の製造イノベーションセンターにプロトタイプVDIを展開したユーザー調査を通じて、代表的な産業用タスクでVDIを実証しました。
私たちの研究からの相互作用は、VDIのさまざまなデモンストレーションタイプの実用的な価値を強調し、VDIのさまざまな産業ユースケースを公開し、将来のツール設計に関する洞察を提供します。

要約(オリジナル)

Previous methods for Learning from Demonstration leverage several approaches for a human to teach motions to a robot, including teleoperation, kinesthetic teaching, and natural demonstrations. However, little previous work has explored more general interfaces that allow for multiple demonstration types. Given the varied preferences of human demonstrators and task characteristics, a flexible tool that enables multiple demonstration types could be crucial for broader robot skill training. In this work, we propose Versatile Demonstration Interface (VDI), an attachment for collaborative robots that simplifies the collection of three common types of demonstrations. Designed for flexible deployment in industrial settings, our tool requires no additional instrumentation of the environment. Our prototype interface captures human demonstrations through a combination of vision, force sensing, and state tracking (e.g., through the robot proprioception or AprilTag tracking). Through a user study where we deployed our prototype VDI at a local manufacturing innovation center with manufacturing experts, we demonstrated VDI in representative industrial tasks. Interactions from our study highlight the practical value of VDI’s varied demonstration types, expose a range of industrial use cases for VDI, and provide insights for future tool design.

arxiv情報

著者 Michael Hagenow,Dimosthenis Kontogiorgos,Yanwei Wang,Julie Shah
発行日 2025-03-13 15:59:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Versatile Demonstration Interface: Toward More Flexible Robot Demonstration Collection はコメントを受け付けていません

NuExo: A Wearable Exoskeleton Covering all Upper Limb ROM for Outdoor Data Collection and Teleoperation of Humanoid Robots

要約

モーションキャプチャとテレオ操作からロボットスキル学習への進化は、具体化された知性を進めるためのホットスポットと重要な経路として浮上しています。
ただし、既存のシステムは、延長期間にわたる完全な上肢の動きの正確な追跡(精度)、人間の生体力学(快適性)への人間工学的適応(快適性)、汎用性のあるデータ収集(力データなど)、およびヒューマノイドロボット(汎用性)との適合性、および屋外での日常の使用のための軽量設計(Contune)の4つの目的を達成するという同時に、依然として持続的なギャップに直面しています。
このギャップを埋めるために、ユーザーフレンドリーな没入型のテレオ操作とマルチモーダルセンシングコレクションを組み込んだウェアラブルエキソ販売システムを紹介します。
同期されたリンケージとタイミングベルト伝送を備えた新しい肩のメカニズムの特徴により、このシステムは複合肩の動きに適応し、自然な上肢の動き範囲を100%カバーすることができます。
5.2 kgの重量のNuexoは、バックパックタイプの使用をサポートしており、毎日の屋外シナリオに便利に適用できます。
さらに、さまざまなヒューマノイドロボットのマルチモーダルセンシングを統合する統合された直感的なテレオ操作フレームワークと包括的なデータ収集システムを開発します。
異なるヒューマノイドプラットフォームとさまざまなユーザーの実験は、動的なシナリオでのデータ収集と遠隔操作の精度の安定性を確認しながら、モーション範囲と柔軟性における外骨格の優位性を検証します。

要約(オリジナル)

The evolution from motion capture and teleoperation to robot skill learning has emerged as a hotspot and critical pathway for advancing embodied intelligence. However, existing systems still face a persistent gap in simultaneously achieving four objectives: accurate tracking of full upper limb movements over extended durations (Accuracy), ergonomic adaptation to human biomechanics (Comfort), versatile data collection (e.g., force data) and compatibility with humanoid robots (Versatility), and lightweight design for outdoor daily use (Convenience). We present a wearable exoskeleton system, incorporating user-friendly immersive teleoperation and multi-modal sensing collection to bridge this gap. Due to the features of a novel shoulder mechanism with synchronized linkage and timing belt transmission, this system can adapt well to compound shoulder movements and replicate 100% coverage of natural upper limb motion ranges. Weighing 5.2 kg, NuExo supports backpack-type use and can be conveniently applied in daily outdoor scenarios. Furthermore, we develop a unified intuitive teleoperation framework and a comprehensive data collection system integrating multi-modal sensing for various humanoid robots. Experiments across distinct humanoid platforms and different users validate our exoskeleton’s superiority in motion range and flexibility, while confirming its stability in data collection and teleoperation accuracy in dynamic scenarios.

arxiv情報

著者 Rui Zhong,Chuang Cheng,Junpeng Xu,Yantong Wei,Ce Guo,Daoxun Zhang,Wei Dai,Huimin Lu
発行日 2025-03-13 17:10:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | NuExo: A Wearable Exoskeleton Covering all Upper Limb ROM for Outdoor Data Collection and Teleoperation of Humanoid Robots はコメントを受け付けていません

Towards Safe Path Tracking Using the Simplex Architecture

要約

複雑な環境でのロボットナビゲーションには、適応的で安全なコントローラーが必要です。
規制された純粋な追跡、動的ウィンドウアプローチ、モデル予測パスの積分などの従来のコントローラーは、信頼できるものの、動的条件に適応するのに苦労しています。
強化学習は適応性を提供しますが、正式な安全保証がありません。
これに対処するために、シンプレックスアーキテクチャを活用するパス追跡コントローラーを提案します。
適応性とパフォーマンスのための強化学習コントローラーと、安全性と安定性を提供する高保険コントローラーを組み合わせています。
私たちの貢献は2つあります。
まず、シンプレックスアーキテクチャを使用してコントローラーを設計するための一般的な安定性と安全性に関する考慮事項について説明します。
第二に、シンプレックスベースのパス追跡コントローラーを提示します。
予備のフィールド内テストでサポートされているシミュレーション結果は、最先端の方法に匹敵するパフォーマンスを達成しながら、安全性を維持するコントローラーの有効性を示しています。

要約(オリジナル)

Robot navigation in complex environments necessitates controllers that are adaptive and safe. Traditional controllers like Regulated Pure Pursuit, Dynamic Window Approach, and Model-Predictive Path Integral, while reliable, struggle to adapt to dynamic conditions. Reinforcement Learning offers adaptability but lacks formal safety guarantees. To address this, we propose a path tracking controller leveraging the Simplex architecture. It combines a Reinforcement Learning controller for adaptiveness and performance with a high-assurance controller providing safety and stability. Our contribution is twofold. We firstly discuss general stability and safety considerations for designing controllers using the Simplex architecture. Secondly, we present a Simplex-based path tracking controller. Our simulation results, supported by preliminary in-field tests, demonstrate the controller’s effectiveness in maintaining safety while achieving comparable performance to state-of-the-art methods.

arxiv情報

著者 Georg Jäger,Nils-Jonathan Friedrich,Hauke Petersen,Benjamin Noack
発行日 2025-03-13 17:11:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Towards Safe Path Tracking Using the Simplex Architecture はコメントを受け付けていません