Inflatable Kirigami Crawlers

要約

キリガミは、カットのジオメトリを活用することにより、ガイド付きモーフィングのユニークな機会を提供します。
この作品は、周期的な空気圧作動時の運動を実現するために、熱に密集可能なテキスタイルにカットパターンを導入することによって作成されたインフレータブルキリガミクローラーを提示します。
従来のエアポーチを膨らませると、対称的な膨らみと収縮が生じます。
膨らんだキリガミアクチュエーターでは、蓄積された圧縮力が対称性を均一に破壊し、2倍の単純な空気ポーチと比較して収縮を強化し、新たなスケールのような特徴を備えた建築表面にオーバーラップおよび自己組織化される密封されたエッジの局所回転を引き起こします。
その結果、膨張型のキリガミアクチュエーターは、非対称の局所的な面外変形を伴う均一で制御された収縮を示します。
このプロセスにより、幾何学的および物質的な非線形性を活用して、膨張型の繊維ベースのキリガミアクチュエーターを予測可能な機関車機能に吹き込むことができます。
これらのアクチュエーターのプログラムされた変形と摩擦への影響を徹底的に特徴づけました。
キリガミのアクチュエーターは、膨らむと方向性異方性摩擦特性を示すことがわかりました。動きの方向に対してより高い摩擦係数を持ち、粗さが異なる表面を横切って移動できるようにします。
さらに、複数のチャネルとセグメントを導入して、多用途の移動能力を備えた機能的なソフトロボットプロトタイプを作成することにより、インフレータブルキリガミアクチュエーターの機能をさらに強化しました。

要約(オリジナル)

Kirigami offers unique opportunities for guided morphing by leveraging the geometry of the cuts. This work presents inflatable kirigami crawlers created by introducing cut patterns into heat-sealable textiles to achieve locomotion upon cyclic pneumatic actuation. Inflating traditional air pouches results in symmetric bulging and contraction. In inflated kirigami actuators, the accumulated compressive forces uniformly break the symmetry, enhance contraction compared to simple air pouches by two folds, and trigger local rotation of the sealed edges that overlap and self-assemble into an architected surface with emerging scale-like features. As a result, the inflatable kirigami actuators exhibit a uniform, controlled contraction with asymmetric localized out-of-plane deformations. This process allows us to harness the geometric and material nonlinearities to imbue inflatable textile-based kirigami actuators with predictable locomotive functionalities. We thoroughly characterized the programmed deformations of these actuators and their impact on friction. We found that the kirigami actuators exhibit directional anisotropic friction properties when inflated, having higher friction coefficients against the direction of the movement, enabling them to move across surfaces with varying roughness. We further enhanced the functionality of inflatable kirigami actuators by introducing multiple channels and segments to create functional soft robotic prototypes with versatile locomotion capabilities.

arxiv情報

著者 Burcu Seyidoğlu,Aida Parvaresh,Bahman Taherkhani,Ahmad Rafsanjani
発行日 2025-02-10 13:47:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Inflatable Kirigami Crawlers はコメントを受け付けていません

SIREN: Semantic, Initialization-Free Registration of Multi-Robot Gaussian Splatting Maps

要約

マルチロボットガウススプラッティング(GSPLAT)マップの登録のためにサイレンを提示し、ローカルサブマップの初期化または融合のためにカメラのポーズ、画像、およびインターマップ変換にアクセスしていません。
これらの機能を実現するために、サイレンは、マルチロボットGSPLATマップの厳格な登録パイプラインを導き出すために、3つの重要な方法でセマンティクスの汎用性と堅牢性を活用します。
まず、Sirenはセマンティクスを利用して、登録問題がより適切に提起されるローカルマップの機能が豊富な領域を特定し、以前の作業で一般的に必要な初期化の必要性を排除します。
第二に、サイレンは、堅牢なセマンティック機能を使用してローカルマップのガウス間の候補の対応を特定し、堅牢な幾何学的最適化の基礎を構成し、ローカルマップから抽出された3Dガウスのプリミティブを粗く整列させます。
第三に、この重要なステップにより、サブマップ間の変換の後続の測光精製が可能になります。サイレンは、GSPLATマップの新規ビュー合成とセマンティクスベースの画像フィルターを活用して、高精度の非剛性変換を計算して、高い高度の非剛性変換を計算します。
– フィデリティ融合マップ。
さまざまな現実世界のデータセット、特にマニピュレーター、ドローン、4倍などの最も広く使用されているロボットハードウェアプラットフォームで競合するベースラインと比較して、サイレンの優れた性能を示します。
実験では、サイレンは、競合する方法が苦労している最も挑戦的なシーンで、約90倍の小さな回転エラー、300倍の小さな翻訳エラー、44倍の小さなスケールエラーを達成します。
レビュープロセスの後、コードをリリースし、プロジェクトページへのリンクを提供します。

要約(オリジナル)

We present SIREN for registration of multi-robot Gaussian Splatting (GSplat) maps, with zero access to camera poses, images, and inter-map transforms for initialization or fusion of local submaps. To realize these capabilities, SIREN harnesses the versatility and robustness of semantics in three critical ways to derive a rigorous registration pipeline for multi-robot GSplat maps. First, SIREN utilizes semantics to identify feature-rich regions of the local maps where the registration problem is better posed, eliminating the need for any initialization which is generally required in prior work. Second, SIREN identifies candidate correspondences between Gaussians in the local maps using robust semantic features, constituting the foundation for robust geometric optimization, coarsely aligning 3D Gaussian primitives extracted from the local maps. Third, this key step enables subsequent photometric refinement of the transformation between the submaps, where SIREN leverages novel-view synthesis in GSplat maps along with a semantics-based image filter to compute a high-accuracy non-rigid transformation for the generation of a high-fidelity fused map. We demonstrate the superior performance of SIREN compared to competing baselines across a range of real-world datasets, and in particular, across the most widely-used robot hardware platforms, including a manipulator, drone, and quadruped. In our experiments, SIREN achieves about 90x smaller rotation errors, 300x smaller translation errors, and 44x smaller scale errors in the most challenging scenes, where competing methods struggle. We will release the code and provide a link to the project page after the review process.

arxiv情報

著者 Ola Shorinwa,Jiankai Sun,Mac Schwager,Anirudha Majumdar
発行日 2025-02-10 14:41:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | SIREN: Semantic, Initialization-Free Registration of Multi-Robot Gaussian Splatting Maps はコメントを受け付けていません

Predictive Red Teaming: Breaking Policies Without Breaking Robots

要約

模倣学習を介して訓練された視覚運動ポリシーは、挑戦的な操作タスクを実行することができますが、照明、視覚的なディストラクタ、オブジェクトの場所に非常に脆弱です。
これらの脆弱性は、トレーニングの詳細に予測不可能に依存する可能性があり、時間のかかる高価なハードウェアの評価なしに暴露することが困難です。
予測的な赤チーム化の問題を提案します。環境要因に関するポリシーの脆弱性を発見し、対象のシナリオでハードウェア評価なしで対応するパフォーマンス分解を予測します。
これを達成するために、Roboart:自動赤チーム(ART)パイプラインを開発します。
編集された観測で実行された検出器。
視覚運動拡散ポリシーの12回の統一条件での500以上のハードウェアトライアルにわたる実験は、Roboartが高精度でパフォーマンス分解を予測することを示しています(予測された成功率と実際の成功率の平均差は0.19未満です)。
また、予測的な赤チームがターゲットを絞ったデータ収集を可能にする方法を示します。有利なブーストであると予測される条件下で収集されたデータを微調整すると、ベースラインのパフォーマンスは2-7倍です。

要約(オリジナル)

Visuomotor policies trained via imitation learning are capable of performing challenging manipulation tasks, but are often extremely brittle to lighting, visual distractors, and object locations. These vulnerabilities can depend unpredictably on the specifics of training, and are challenging to expose without time-consuming and expensive hardware evaluations. We propose the problem of predictive red teaming: discovering vulnerabilities of a policy with respect to environmental factors, and predicting the corresponding performance degradation without hardware evaluations in off-nominal scenarios. In order to achieve this, we develop RoboART: an automated red teaming (ART) pipeline that (1) modifies nominal observations using generative image editing to vary different environmental factors, and (2) predicts performance under each variation using a policy-specific anomaly detector executed on edited observations. Experiments across 500+ hardware trials in twelve off-nominal conditions for visuomotor diffusion policies demonstrate that RoboART predicts performance degradation with high accuracy (less than 0.19 average difference between predicted and real success rates). We also demonstrate how predictive red teaming enables targeted data collection: fine-tuning with data collected under conditions predicted to be adverse boosts baseline performance by 2-7x.

arxiv情報

著者 Anirudha Majumdar,Mohit Sharma,Dmitry Kalashnikov,Sumeet Singh,Pierre Sermanet,Vikas Sindhwani
発行日 2025-02-10 15:44:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY | Predictive Red Teaming: Breaking Policies Without Breaking Robots はコメントを受け付けていません

Continual Learning from Simulated Interactions via Multitask Prospective Rehearsal for Bionic Limb Behavior Modeling

要約

下肢切断と神経筋の障害は、可動性を厳しく制限し、従来の義肢を超えた進歩を必要とします。
電動化されたバイオニック肢は有望ですが、それらの有効性は、多様な環境にわたる人間の動きの動的な調整を複製することに依存します。
この論文では、バイオニックプロテーゼコントロールの文脈で人間の行動のモデルを紹介します。
私たちのアプローチは、人間の移動デモンストレーションを活用して、下肢の相乗的な結合を学習し、歩行、登山、階段、階段などのタスク中に欠けている手足の運動学的挙動の予測を可能にします。
時間の経過とともに動きを予測および改良するマルチタスクの継続的な適応モデルを提案します。
私たちの方法の中核には、MultiTaskの前向きリハーサルと呼ばれる手法があります。これは、以前の予測に基づいて将来の動きを予測および統合し、その後の予測のための修正メカニズムを採用しています。
進化するアーキテクチャは、共有バックボーン上に軽量のタスク固有のモジュールをマージし、特異性とスケーラビリティの両方を確保します。
幅広い運動タスクにわたる、鎖角切断者を含む現実世界の人間の歩行データセットに関する実験を通じてモデルを検証します。
結果は、私たちのアプローチが、特に分布シフト、敵対的な摂動、騒音を備えたシナリオで、ベースラインモデルよりも一貫して優れていることを示しています。

要約(オリジナル)

Lower limb amputations and neuromuscular impairments severely restrict mobility, necessitating advancements beyond conventional prosthetics. While motorized bionic limbs show promise, their effectiveness depends on replicating the dynamic coordination of human movement across diverse environments. In this paper, we introduce a model for human behavior in the context of bionic prosthesis control. Our approach leverages human locomotion demonstrations to learn the synergistic coupling of the lower limbs, enabling the prediction of the kinematic behavior of a missing limb during tasks such as walking, climbing inclines, and stairs. We propose a multitasking, continually adaptive model that anticipates and refines movements over time. At the core of our method is a technique called multitask prospective rehearsal, that anticipates and synthesizes future movements based on the previous prediction and employs a corrective mechanism for subsequent predictions. Our evolving architecture merges lightweight, task-specific modules on a shared backbone, ensuring both specificity and scalability. We validate our model through experiments on real-world human gait datasets, including transtibial amputees, across a wide range of locomotion tasks. Results demonstrate that our approach consistently outperforms baseline models, particularly in scenarios with distributional shifts, adversarial perturbations, and noise.

arxiv情報

著者 Sharmita Dey,Benjamin Paassen,Sarath Ravindran Nair,Sabri Boughorbel,Arndt F. Schilling
発行日 2025-02-10 16:13:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | Continual Learning from Simulated Interactions via Multitask Prospective Rehearsal for Bionic Limb Behavior Modeling はコメントを受け付けていません

Discovery of skill switching criteria for learning agile quadruped locomotion

要約

このホワイトペーパーでは、適切に調整された多目的移動を学習し、実現できる階層的な学習と最適化フレームワークを開発します。
学習したマルチスキルポリシーは、arbitrarily意的に位置付けられた目標を追跡する際に、スキルを自動的かつ自然に切り替え、迅速に失敗から回復することができます。
提案されたフレームワークは、深い強化学習プロセスと最適化プロセスで構成されています。
まず、連絡先パターンは、他の参照を必要とせずに、さまざまなタイプの歩行を個別のポリシーとして学習するための報酬条件に組み込まれます。
次に、個々のポリシーの重みを生成して、目標追跡タスク設定でマルチスキルの移動を作成するために、より高いレベルのポリシーが学習されます。
スキルは、目標までの距離に応じて自動的かつ自然に切り替えられます。
スキルスイッチングの適切な距離は、高レベルのポリシーを学習するための報酬計算に組み込まれ、学習が進行するにつれて外部最適化ループによって更新されます。
最初に、シミュレートされたUNINTREE A1四足動物ロボットの包括的なタスクにおけるマルチスキルの移動が成功しました。
また、目標の位置が変化するにつれて、速歩、境界、ギャロッピング、およびその自然な移行を示す現実世界で学んだポリシーを展開しました。
さらに、学習したポリシーは、いつでも予期しない障害に反応し、迅速な回復を実行し、移動を正常に再開できます。
現実世界でのギャロッピングへの移行に失敗した単一のスキル間の個別のスイッチと比較して、提案されたアプローチは、よりスムーズで継続的なスキル移行で、学習したすべてのアジャイルスキルを達成します。

要約(オリジナル)

This paper develops a hierarchical learning and optimization framework that can learn and achieve well-coordinated multi-skill locomotion. The learned multi-skill policy can switch between skills automatically and naturally in tracking arbitrarily positioned goals and recover from failures promptly. The proposed framework is composed of a deep reinforcement learning process and an optimization process. First, the contact pattern is incorporated into the reward terms for learning different types of gaits as separate policies without the need for any other references. Then, a higher level policy is learned to generate weights for individual policies to compose multi-skill locomotion in a goal-tracking task setting. Skills are automatically and naturally switched according to the distance to the goal. The proper distances for skill switching are incorporated in reward calculation for learning the high level policy and updated by an outer optimization loop as learning progresses. We first demonstrated successful multi-skill locomotion in comprehensive tasks on a simulated Unitree A1 quadruped robot. We also deployed the learned policy in the real world showcasing trotting, bounding, galloping, and their natural transitions as the goal position changes. Moreover, the learned policy can react to unexpected failures at any time, perform prompt recovery, and resume locomotion successfully. Compared to discrete switch between single skills which failed to transition to galloping in the real world, our proposed approach achieves all the learned agile skills, with smoother and more continuous skill transitions.

arxiv情報

著者 Wanming Yu,Fernando Acero,Vassil Atanassov,Chuanyu Yang,Ioannis Havoutis,Dimitrios Kanoulas,Zhibin Li
発行日 2025-02-10 17:01:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Discovery of skill switching criteria for learning agile quadruped locomotion はコメントを受け付けていません

HetSwarm: Cooperative Navigation of Heterogeneous Swarm in Dynamic and Dense Environments through Impedance-based Guidance

要約

効率的な物流と倉庫管理に対する需要の高まりに伴い、無人航空機(UAV)は、自動誘導車両(AGV)の貴重な補完として浮上しています。
UAVは、密な環境をナビゲートし、さまざまな高度で動作することにより、効率を向上させます。
ただし、限られた飛行時間、バッテリー寿命、ペイロード容量は、サポートする地上局を必要とします。
これらの課題に対処するために、UAVとモバイルグラウンドロボットを組み合わせた不均一なマルチロボットシステムであるHetswarmを提案します。
私たちのアプローチでは、UAVの人工電位フィールド(APF)ベースのパスプランナーを採用しているため、軌道をリアルタイムで動的に調整できます。
地上ロボットは、インピーダンスリンクを介した接続性を維持しながら、このパスをたどり、安定した調整を確保します。
さらに、地上ロボットは、これらの障害がUAVの飛行を妨げないため、地元の衝突を避けるために、低い高さの地上障害との時間的インピーダンスリンクを確立します。
多様な環境条件におけるヘツワームの実験的検証により、30のテストケースで90%の成功率が示されました。
地上ロボットは、障害物近くで45 cmの平均偏差を示し、効果的な衝突回避を確認しました。
ジムPybullet環境での広範なシミュレーションにより、実際のアプリケーションのシステムの堅牢性がさらに検証され、散らかった環境での動的でリアルタイムのタスク実行の可能性が示されました。

要約(オリジナル)

With the growing demand for efficient logistics and warehouse management, unmanned aerial vehicles (UAVs) are emerging as a valuable complement to automated guided vehicles (AGVs). UAVs enhance efficiency by navigating dense environments and operating at varying altitudes. However, their limited flight time, battery life, and payload capacity necessitate a supporting ground station. To address these challenges, we propose HetSwarm, a heterogeneous multi-robot system that combines a UAV and a mobile ground robot for collaborative navigation in cluttered and dynamic conditions. Our approach employs an artificial potential field (APF)-based path planner for the UAV, allowing it to dynamically adjust its trajectory in real time. The ground robot follows this path while maintaining connectivity through impedance links, ensuring stable coordination. Additionally, the ground robot establishes temporal impedance links with low-height ground obstacles to avoid local collisions, as these obstacles do not interfere with the UAV’s flight. Experimental validation of HetSwarm in diverse environmental conditions demonstrated a 90% success rate across 30 test cases. The ground robot exhibited an average deviation of 45 cm near obstacles, confirming effective collision avoidance. Extensive simulations in the Gym PyBullet environment further validated the robustness of our system for real-world applications, demonstrating its potential for dynamic, real-time task execution in cluttered environments.

arxiv情報

著者 Malaika Zafar,Roohan Ahmed Khan,Aleksey Fedoseev,Kumar Katyayan Jaiswal,Dzmitry Tsetserukou
発行日 2025-02-10 17:53:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | HetSwarm: Cooperative Navigation of Heterogeneous Swarm in Dynamic and Dense Environments through Impedance-based Guidance はコメントを受け付けていません

AgilePilot: DRL-Based Drone Agent for Real-Time Motion Planning in Dynamic Environments by Leveraging Object Detection

要約

動的環境での自律的なドローンナビゲーションは、特に急速に変化する目標位置を持つ急速に変化するオブジェクトを含む予測不可能なシナリオを扱う場合、重要な課題のままです。
従来のプランナーと古典的な最適化方法は、この動的な問題に対処するために広く使用されていますが、多くの場合、リアルタイムで予測不可能な変更に直面し、最終的に適応性とリアルタイムの意思決定の点で最適なパフォーマンスにつながります。
この作業では、飛行中のオブジェクト検出のためのリアルタイムコンピュータービジョン(CV)と相まって、動的条件でトレーニングされたディープ補強学習(DRL)に基づいた、新しいモーションプランナーであるAgilepilotを提案します。
トレーニング間の展開フレームワークは、環境の状態に応じて安全性と敏ility性の両方を促進する洗練された報酬構造を活用して、Sim2realギャップを橋渡しします。
このシステムは、変化する環境に迅速に適応でき、現実世界のシナリオでは3.0 m/sの最大速度を達成できます。
それに比べて、私たちのアプローチは、75の実施された実験で90%の成功率を示しながら、速度予測を使用して動的ターゲットのパフォーマンスと追跡精度の両方で、人工電位フィールド(APF)ベースのモーションプランナーなどの古典的なアルゴリズムを3回上回ります。
この作業は、リアルタイムの動的ナビゲーションの課題への取り組みにおけるDRLの有効性を強調し、インテリジェントな安全性と敏ility性を提供します。

要約(オリジナル)

Autonomous drone navigation in dynamic environments remains a critical challenge, especially when dealing with unpredictable scenarios including fast-moving objects with rapidly changing goal positions. While traditional planners and classical optimisation methods have been extensively used to address this dynamic problem, they often face real-time, unpredictable changes that ultimately leads to sub-optimal performance in terms of adaptiveness and real-time decision making. In this work, we propose a novel motion planner, AgilePilot, based on Deep Reinforcement Learning (DRL) that is trained in dynamic conditions, coupled with real-time Computer Vision (CV) for object detections during flight. The training-to-deployment framework bridges the Sim2Real gap, leveraging sophisticated reward structures that promotes both safety and agility depending upon environment conditions. The system can rapidly adapt to changing environments, while achieving a maximum speed of 3.0 m/s in real-world scenarios. In comparison, our approach outperforms classical algorithms such as Artificial Potential Field (APF) based motion planner by 3 times, both in performance and tracking accuracy of dynamic targets by using velocity predictions while exhibiting 90% success rate in 75 conducted experiments. This work highlights the effectiveness of DRL in tackling real-time dynamic navigation challenges, offering intelligent safety and agility.

arxiv情報

著者 Roohan Ahmed Khan,Valerii Serpiva,Demetros Aschalew,Aleksey Fedoseev,Dzmitry Tsetserukou
発行日 2025-02-10 17:54:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | AgilePilot: DRL-Based Drone Agent for Real-Time Motion Planning in Dynamic Environments by Leveraging Object Detection はコメントを受け付けていません

Rough Stochastic Pontryagin Maximum Principle and an Indirect Shooting Method

要約

ガウスのラフパスによって駆動される粗微分方程式(RDE)によってモデル化されたシステムの決定論的制御を使用して、確率的最適制御のための1次ポントリアギンの最適性条件を導き出します。
このポントリアギンの最大原理(PMP)は、ブラウン運動によって駆動される確率的微分方程式(SDE)に続くシステムに適用されますが、前方逆座標SDEに依存せず、決定論的PMPと同じハミルトニアンを含みます。
この証明は、ガウスラフパスの最近の結果を活用することにより、非線形および線形RDEのソリューションのさまざまな統合エラーバウンドを最初に導き出すことで構成されています。
PMPは、針のようなバリエーションに基づいて標準的な手法を使用して続きます。
アプリケーションとして、非線形確率的最適制御のための最初の間接射撃方法を提案し、安定化タスクの直接的な方法よりも10倍速く収束することを示します。

要約(オリジナル)

We derive first-order Pontryagin optimality conditions for stochastic optimal control with deterministic controls for systems modeled by rough differential equations (RDE) driven by Gaussian rough paths. This Pontryagin Maximum Principle (PMP) applies to systems following stochastic differential equations (SDE) driven by Brownian motion, yet it does not rely on forward-backward SDEs and involves the same Hamiltonian as the deterministic PMP. The proof consists of first deriving various integrable error bounds for solutions to nonlinear and linear RDEs by leveraging recent results on Gaussian rough paths. The PMP then follows using standard techniques based on needle-like variations. As an application, we propose the first indirect shooting method for nonlinear stochastic optimal control and show that it converges 10x faster than a direct method on a stabilization task.

arxiv情報

著者 Thomas Lew
発行日 2025-02-10 17:55:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY, math.OC, math.PR | Rough Stochastic Pontryagin Maximum Principle and an Indirect Shooting Method はコメントを受け付けていません

Infinite-Horizon Value Function Approximation for Model Predictive Control

要約

モデル予測制御は、ロボットが複雑な動きを生成するための一般的なツールとして浮上しています。
ただし、リアルタイムの要件により、安全性と安定性を確保するために必要なハード制約と大規模なプレビュー視野の使用が制限されています。
実際には、実務家は、無限の地平線の定式化を模倣できるコスト関数を慎重に設計する必要があります。
この作業では、値の反復と軌跡の最適化を使用して、ニューラルネットワークで制約された最適な制御問題の無限の地平線価値関数を概算する方法を研究します。
さらに、この値関数近似を端子コストとして使用すると、モデル予測コントローラーにグローバルな安定性がどのように提供されるかを示します。
このアプローチは、2つのおもちゃの問題と、価値関数が目標と障害に条件付けられている産業マニピュレーターのオンライン障害回避を伴う現実世界のシナリオで検証されています。

要約(オリジナル)

Model Predictive Control has emerged as a popular tool for robots to generate complex motions. However, the real-time requirement has limited the use of hard constraints and large preview horizons, which are necessary to ensure safety and stability. In practice, practitioners have to carefully design cost functions that can imitate an infinite horizon formulation, which is tedious and often results in local minima. In this work, we study how to approximate the infinite horizon value function of constrained optimal control problems with neural networks using value iteration and trajectory optimization. Furthermore, we demonstrate how using this value function approximation as a terminal cost provides global stability to the model predictive controller. The approach is validated on two toy problems and a real-world scenario with online obstacle avoidance on an industrial manipulator where the value function is conditioned to the goal and obstacle.

arxiv情報

著者 Armand Jordana,Sébastien Kleff,Arthur Haffemayer,Joaquim Ortiz-Haro,Justin Carpentier,Nicolas Mansard,Ludovic Righetti
発行日 2025-02-10 18:40:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Infinite-Horizon Value Function Approximation for Model Predictive Control はコメントを受け付けていません

Adaptive Nonlinear Model Predictive Control for a Real-World Labyrinth Game

要約

現実世界の迷路ゲームを解決するための非線形非凸モデル予測制御アプローチを提示します。
迷路内の非凸障害を表す適応的な非線形制約を導入します。
私たちの方法は、計算が多い最適化問題を2つの層に分割します。
第一に、完全な問題の定式化を組み込んでおり、低周波数で擬似グローバル最適な軌跡を見つける高レベルのモデル予測コントローラー。
第二に、指定された高レベルのパスをリアルタイムで追跡するために最適化問題の縮小された計算的に最適化されたバージョンを受信する低レベルモデル予測コントローラー。
さらに、迷路の表面の不規則性の地図が学習されます。
当社のコントローラーは、迷路で遭遇する主要な障害とモデルの不正確さを処理し、他の古典的な制御方法を上回ることができます。

要約(オリジナル)

We present a nonlinear non-convex model predictive control approach to solving a real-world labyrinth game. We introduce adaptive nonlinear constraints, representing the non-convex obstacles within the labyrinth. Our method splits the computation-heavy optimization problem into two layers; first, a high-level model predictive controller which incorporates the full problem formulation and finds pseudo-global optimal trajectories at a low frequency. Secondly, a low-level model predictive controller that receives a reduced, computationally optimized version of the optimization problem to follow the given high-level path in real-time. Further, a map of the labyrinth surface irregularities is learned. Our controller is able to handle the major disturbances and model inaccuracies encountered on the labyrinth and outperforms other classical control methods.

arxiv情報

著者 Johannes Gaber,Thomas Bi,Raffaello D’Andrea
発行日 2025-02-10 18:41:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Adaptive Nonlinear Model Predictive Control for a Real-World Labyrinth Game はコメントを受け付けていません