Actor-Critic Model Predictive Control: Differentiable Optimization meets Reinforcement Learning

要約

ロボット工学におけるオープンな研究の質問は、モデルのないタスクのパフォーマンスと一般的な報酬の定式化の最適化における柔軟性で知られるモデルフリー強化学習(RL)の利点を組み合わせる方法と、モデル予測制御(MPC)の堅牢性とオンラインの再生機能を組み合わせることです。

このペーパーでは、Actor-Critic Model Predictive Controlという新しいフレームワークを導入することにより、回答を提供します。
重要なアイデアは、俳優critic RLフレームワークに微分可能なMPCを埋め込むことです。
この統合により、MPCを介した制御アクションの短期予測最適化が可能になり、長い視野にわたってエンドツーエンドの学習と探索のためにRLを活用できます。
さまざまなアブレーション研究を通じて、提案されたアプローチの利点を明らかにします。それは、より良い分散式行動、ダイナミクスの変化に対するより良い堅牢性を達成し、サンプル効率を改善します。
さらに、批評家の学習価値関数と微分可能なMPCのコスト関数との関係を明らかにする経験的分析を実施し、批評家の価値とMPCコスト関数の相互作用をより深く理解します。
最後に、シミュレーションと現実世界の両方で、さまざまなトラックのドローンレースタスクでメソッドを検証します。
私たちの方法は、最先端のモデルのないRLと同じ超人性パフォーマンスを達成し、最大21 m/sの速度を紹介します。
提案されたアーキテクチャは、リアルタイムの制御パフォーマンスを実現し、試行錯誤を介して複雑な動作を学習し、MPCの予測特性を保持して、分散型の動作をよりよく処理することができることを示します。

要約(オリジナル)

An open research question in robotics is how to combine the benefits of model-free reinforcement learning (RL) – known for its strong task performance and flexibility in optimizing general reward formulations – with the robustness and online replanning capabilities of model predictive control (MPC). This paper provides an answer by introducing a new framework called Actor-Critic Model Predictive Control. The key idea is to embed a differentiable MPC within an actor-critic RL framework. This integration allows for short-term predictive optimization of control actions through MPC, while leveraging RL for end-to-end learning and exploration over longer horizons. Through various ablation studies, we expose the benefits of the proposed approach: it achieves better out-of-distribution behaviour, better robustness to changes in the dynamics and improved sample efficiency. Additionally, we conduct an empirical analysis that reveals a relationship between the critic’s learned value function and the cost function of the differentiable MPC, providing a deeper understanding of the interplay between the critic’s value and the MPC cost functions. Finally, we validate our method in a drone racing task on different tracks, in both simulation and the real world. Our method achieves the same superhuman performance as state-of-the-art model-free RL, showcasing speeds of up to 21 m/s. We show that the proposed architecture can achieve real-time control performance, learn complex behaviors via trial and error, and retain the predictive properties of the MPC to better handle out-of-distribution behavior.

arxiv情報

著者 Angel Romero,Elie Aljalbout,Yunlong Song,Davide Scaramuzza
発行日 2025-02-05 10:45:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, G.1.6 | Actor-Critic Model Predictive Control: Differentiable Optimization meets Reinforcement Learning はコメントを受け付けていません

RoboGrasp: A Universal Grasping Policy for Robust Robotic Control

要約

模倣学習と世界モデルは、一般化可能なロボット学習を進めることに大きな約束を示しており、ロボットグラストは正確な操作を達成するための重要な課題であり続けています。
既存の方法は、多くの場合、ロボットアームの状態データとRGB画像に大きく依存しており、特定のオブジェクトの形状または位置に過度に適合します。
これらの制限に対処するために、前処理された把握検出モデルをロボット学習と統合する普遍的な把握政策フレームワークであるRobograspを提案します。
オブジェクトの検出とセグメンテーションタスクから堅牢な視覚ガイダンスを活用することにより、Robograspは把握精度、安定性、および一般化を大幅に向上させ、少ないショット学習とグレーシングボックスプロンプトタスクで最大34%高い成功率を達成します。
拡散ベースの方法に基づいて、Robograspはさまざまなロボット学習パラダイムに適応でき、多様で複雑なシナリオ全体で正確で信頼できる操作を可能にします。
このフレームワークは、ロボット把握における現実世界の課題に取り組むためのスケーラブルで多用途のソリューションを表しています。

要約(オリジナル)

Imitation learning and world models have shown significant promise in advancing generalizable robotic learning, with robotic grasping remaining a critical challenge for achieving precise manipulation. Existing methods often rely heavily on robot arm state data and RGB images, leading to overfitting to specific object shapes or positions. To address these limitations, we propose RoboGrasp, a universal grasping policy framework that integrates pretrained grasp detection models with robotic learning. By leveraging robust visual guidance from object detection and segmentation tasks, RoboGrasp significantly enhances grasp precision, stability, and generalizability, achieving up to 34% higher success rates in few-shot learning and grasping box prompt tasks. Built on diffusion-based methods, RoboGrasp is adaptable to various robotic learning paradigms, enabling precise and reliable manipulation across diverse and complex scenarios. This framework represents a scalable and versatile solution for tackling real-world challenges in robotic grasping.

arxiv情報

著者 Yiqi Huang,Travis Davies,Jiahuan Yan,Xiang Chen,Yu Tian,Luhui Hu
発行日 2025-02-05 11:04:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | RoboGrasp: A Universal Grasping Policy for Robust Robotic Control はコメントを受け付けていません

HiLo: Learning Whole-Body Human-like Locomotion with Motion Tracking Controller

要約

ディープ補強学習(RL)は、ヒューマノイドロボットの移動コントローラーを開発する有望な方法として浮上しています。
以前のRLコントローラーによって実証された堅牢で安定した移動にもかかわらず、それらの動作はしばしば、人間中心のシナリオに必要な自然で機敏なモーションパターンを欠いています。
この作業では、Hilo(モーション追跡による人間のような移動)を提案します。これは、人間のような移動を実行するRLポリシーを学習するために設計された効果的なフレームワークです。
人間のような移動の主な課題は、複雑な報酬エンジニアリングとドメインのランダム化です。
Hiloは、RLベースのモーション追跡コントローラーとランダムな力の注入と作用遅延を介して単純なドメインランダム化を開発することにより、これらの問題を克服します。
HILOのフレームワーク内で、全身制御の問題を2つのコンポーネントに分解できます。1つの部分は、オープンループ制御方法を使用して解決され、残差部分はRLポリシーでアドレス指定されます。
摂動ダイナミクスの下での累積報酬の推定を改善することにより、トレーニングプロセスを安定させるために、分布値関数も実装されています。
私たちの実験は、Hiloを使用して訓練されたモーショントラッキングコントローラーが、実際のシステムの外乱に対する回復力を示しながら、自然で機敏な人間のような移動を実行できることを示しています。
さらに、ヒューマノイドロボットのモーションパターンは、微調整せずに残留メカニズムを通じて適応できることを示し、タスク要件を迅速に調整できるようにします。

要約(オリジナル)

Deep Reinforcement Learning (RL) has emerged as a promising method to develop humanoid robot locomotion controllers. Despite the robust and stable locomotion demonstrated by previous RL controllers, their behavior often lacks the natural and agile motion patterns necessary for human-centric scenarios. In this work, we propose HiLo (human-like locomotion with motion tracking), an effective framework designed to learn RL policies that perform human-like locomotion. The primary challenges of human-like locomotion are complex reward engineering and domain randomization. HiLo overcomes these issues by developing an RL-based motion tracking controller and simple domain randomization through random force injection and action delay. Within the framework of HiLo, the whole-body control problem can be decomposed into two components: One part is solved using an open-loop control method, while the residual part is addressed with RL policies. A distributional value function is also implemented to stabilize the training process by improving the estimation of cumulative rewards under perturbed dynamics. Our experiments demonstrate that the motion tracking controller trained using HiLo can perform natural and agile human-like locomotion while exhibiting resilience to external disturbances in real-world systems. Furthermore, we show that the motion patterns of humanoid robots can be adapted through the residual mechanism without fine-tuning, allowing quick adjustments to task requirements.

arxiv情報

著者 Qiyuan Zhang,Chenfan Weng,Guanwu Li,Fulai He,Yusheng Cai
発行日 2025-02-05 12:29:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | HiLo: Learning Whole-Body Human-like Locomotion with Motion Tracking Controller はコメントを受け付けていません

SPARK: A Modular Benchmark for Humanoid Robot Safety

要約

このペーパーでは、Safe Protective and Assistive Robot Kit(Spark)を紹介します。これは、ヒューマノイドの自律性とテレオ操作の安全性を確保するために設計された包括的なベンチマークです。
ヒューマノイドロボットは、複雑な環境と相互作用する物理的能力のために、重大な安全リスクをもたらします。
ヒューマノイドロボットの物理的な構造は、一般的な安全ソリューションの設計にさらに複雑さを加えます。
複雑なロボットシステムの安全な展開を容易にするために、Sparkは、モジュラーおよび構成可能なロボット制御フレームワークで最先端の安全な制御アルゴリズムを備えたツールボックスとして使用できます。
ユーザーは、安全性とパフォーマンスのバランスを最適化するために、安全基準と感度レベルを簡単に構成できます。
ヒューマノイドの安全性の研究開発を加速するために、Sparkは、さまざまな環境、タスク、ロボットモデルでの安全性のアプローチを比較するシミュレーションベンチマークを提供します。
さらに、Sparkは、実際のロボットに合成されたセーフコントローラーをすばやく展開できます。
ハードウェアの展開のために、SparkはApple Vision Pro(AVP)またはモーションキャプチャシステムを外部センサーとしてサポートし、代替ハードウェアセットアップとシームレスな統合のためのインターフェイスも提供します。
このホワイトペーパーでは、Sparkのシミュレーション実験とUnitree G1ヒューマノイドロボットを使用したケーススタディの両方での能力を示しています。
Sparkのこれらの利点を活用すると、ユーザーと研究者は、ヒューマノイドシステムの安全性を大幅に改善し、関連する研究を加速できます。
オープンソースコードは、https://github.com/intelligent-control-lab/sparkで入手できます。

要約(オリジナル)

This paper introduces the Safe Protective and Assistive Robot Kit (SPARK), a comprehensive benchmark designed to ensure safety in humanoid autonomy and teleoperation. Humanoid robots pose significant safety risks due to their physical capabilities of interacting with complex environments. The physical structures of humanoid robots further add complexity to the design of general safety solutions. To facilitate the safe deployment of complex robot systems, SPARK can be used as a toolbox that comes with state-of-the-art safe control algorithms in a modular and composable robot control framework. Users can easily configure safety criteria and sensitivity levels to optimize the balance between safety and performance. To accelerate humanoid safety research and development, SPARK provides a simulation benchmark that compares safety approaches in a variety of environments, tasks, and robot models. Furthermore, SPARK allows quick deployment of synthesized safe controllers on real robots. For hardware deployment, SPARK supports Apple Vision Pro (AVP) or a Motion Capture System as external sensors, while also offering interfaces for seamless integration with alternative hardware setups. This paper demonstrates SPARK’s capability with both simulation experiments and case studies with a Unitree G1 humanoid robot. Leveraging these advantages of SPARK, users and researchers can significantly improve the safety of their humanoid systems as well as accelerate relevant research. The open-source code is available at https://github.com/intelligent-control-lab/spark.

arxiv情報

著者 Yifan Sun,Rui Chen,Kai S. Yun,Yikuan Fang,Sebin Jung,Feihan Li,Bowei Li,Weiye Zhao,Changliu Liu
発行日 2025-02-05 12:49:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | SPARK: A Modular Benchmark for Humanoid Robot Safety はコメントを受け付けていません

Underwater Soft Fin Flapping Motion with Deep Neural Network Based Surrogate Model

要約

この研究では、ディープニューラルネットワーク(DNN)ベースのサロゲートモデルを強化学習(RL)を統合することにより、フィン作用型の水中ロボットの正確な力制御のための新しいフレームワークを提示します。
水中環境と高い実験コストとの複雑な相互作用に対処するために、DNN代理モデルは、RLエージェントの効率的なトレーニングを可能にするためのシミュレーターとして機能します。
さらに、グリッドスイッチング制御が適用され、特定の力の基準範囲の最適化されたモデルが選択され、制御の精度と安定性が向上します。
実験結果は、代理シミュレーションの訓練を受けたRLエージェントが複雑な推力動きを生成し、実際のソフトフィンアクチュエータの正確な制御を達成することを示しています。
このアプローチは、挑戦的な水中環境におけるフィン作用ロボットの効率的な制御ソリューションを提供します。

要約(オリジナル)

This study presents a novel framework for precise force control of fin-actuated underwater robots by integrating a deep neural network (DNN)-based surrogate model with reinforcement learning (RL). To address the complex interactions with the underwater environment and the high experimental costs, a DNN surrogate model acts as a simulator for enabling efficient training for the RL agent. Additionally, grid-switching control is applied to select optimized models for specific force reference ranges, improving control accuracy and stability. Experimental results show that the RL agent, trained in the surrogate simulation, generates complex thrust motions and achieves precise control of a real soft fin actuator. This approach provides an efficient control solution for fin-actuated robots in challenging underwater environments.

arxiv情報

著者 Yuya Hamamatsu,Pavlo Kupyn,Roza Gkliva,Asko Ristolainen,Maarja Kruusmaa
発行日 2025-02-05 12:57:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | Underwater Soft Fin Flapping Motion with Deep Neural Network Based Surrogate Model はコメントを受け付けていません

A Unified and General Humanoid Whole-Body Controller for Fine-Grained Locomotion

要約

移動は、ヒューマノイドロボットの基本的なスキルです。
しかし、ほとんどの既存の作品は、移動を単一の、退屈な、柔軟性のない、パッシブな動きにしました。
これにより、ヒューマノイドロボットの運動能力が制限されます。
対照的に、人間は、頻度や足の高さなどの歩行パラメーターを走り、ジャンプ、ホッピング、そして細かく調整する多目的な運動能力を備えています。
この論文では、このような汎用性をヒューマノイド運動にもたらすためのソリューションを調査し、それによってHugwbcを提案します。
タスクと行動の側面で一般的なコマンドスペースを設計することにより、シミュレーションで全身のヒューマノイド制御ポリシーを学習するための対称的な損失や介入トレーニングなどの高度な手法を設計することにより、HugwBCにより、実際のヒューマノイドロボットはさまざまな自然な歩きを生成できます。
周波数、フットスイングの高さ、さらに異なる体の高さ、ウエストの回転、ボディピッチなどのカスタマイズ可能なパラメーターを使用して、ウォーキング(ランニング)、ジャンプ、スタンディング、ホッピングを使用して、すべて1つのポリシーにあります。
HugwBCは、移動を超えて、遠隔操作などの外部上半身のコントローラーからのリアルタイム介入もサポートし、機関車の動作の下で正確な制御を維持しながら局所操作を可能にします。
私たちの実験では、すべてのコマンドに対する上半身の介入を伴う、または使用せずにHugwBCの高い追跡精度と堅牢性を検証し、さらに、さまざまなコマンドがヒューマノイドの動きにどのように影響するかについての詳細な分析を提供し、これらのコマンド間の関係に関する洞察を提供します。
私たちの知る限り、HugwBCは、高い堅牢性と柔軟性を備えたこのようなきめの細かい移動行動をサポートする最初のヒューマノイド全身コントローラーです。

要約(オリジナル)

Locomotion is a fundamental skill for humanoid robots. However, most existing works made locomotion a single, tedious, unextendable, and passive movement. This limits the kinematic capabilities of humanoid robots. In contrast, humans possess versatile athletic abilities-running, jumping, hopping, and finely adjusting walking parameters such as frequency, and foot height. In this paper, we investigate solutions to bring such versatility into humanoid locomotion and thereby propose HUGWBC: a unified and general humanoid whole-body controller for fine-grained locomotion. By designing a general command space in the aspect of tasks and behaviors, along with advanced techniques like symmetrical loss and intervention training for learning a whole-body humanoid controlling policy in simulation, HugWBC enables real-world humanoid robots to produce various natural gaits, including walking (running), jumping, standing, and hopping, with customizable parameters such as frequency, foot swing height, further combined with different body height, waist rotation, and body pitch, all in one single policy. Beyond locomotion, HUGWBC also supports real-time interventions from external upper-body controllers like teleoperation, enabling loco-manipulation while maintaining precise control under any locomotive behavior. Our experiments validate the high tracking accuracy and robustness of HUGWBC with/without upper-body intervention for all commands, and we further provide an in-depth analysis of how the various commands affect humanoid movement and offer insights into the relationships between these commands. To our knowledge, HugWBC is the first humanoid whole-body controller that supports such fine-grained locomotion behaviors with high robustness and flexibility.

arxiv情報

著者 Yufei Xue,Wentao Dong,Minghuan Liu,Weinan Zhang,Jiangmiao Pang
発行日 2025-02-05 14:26:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | A Unified and General Humanoid Whole-Body Controller for Fine-Grained Locomotion はコメントを受け付けていません

JAMMit! Monolithic 3D-Printing of a Bead Jamming Soft Pneumatic Arm

要約

3Dプリントされたベローの柔らかい空気圧装置は、柔軟なデザイン、製造の容易さ、大きな変形能力に広く採用されています。
ただし、それらの低い剛性は、実際のアプリケーションを制限します。
ソフトアクチュエーターの剛性を高めるためにいくつかの方法が存在しますが、多くはモノリシックおよび自動添加剤の製造の現代目標に沿っていない複雑な製造プロセスを伴います。
シンプルで、ビーズジャミングは、これらの課題に対するシンプルで効果的な解決策を表しています。
この作品では、ボウル型のビーズの腱駆動型の中央背骨を統合した、軽い柔らかい空気圧腕のモノリシック印刷の方法を紹介します。
私たちは、ジャムされていない状態と妨害された状態の両方における腕の可動域と、さまざまな作動や妨害条件の下での剛性を実験的に特徴付けました。
その結果、運動の範囲を維持し、剛性を最大化することとのトレードオフとして、最適な妨害ポリシーを提供します。
提案された設計は、スイッチを入れているタスクでさらに実証され、実用的なアプリケーションの可能性を示しています。

要約(オリジナル)

3D-printed bellow soft pneumatic arms are widely adopted for their flexible design, ease of fabrication, and large deformation capabilities. However, their low stiffness limits their real-world applications. Although several methods exist to enhance the stiffness of soft actuators, many involve complex manufacturing processes not in line with modern goals of monolithic and automated additive manufacturing. With its simplicity, bead-jamming represents a simple and effective solution to these challenges. This work introduces a method for monolithic printing of a bellow soft pneumatic arm, integrating a tendon-driven central spine of bowl-shaped beads. We experimentally characterized the arm’s range of motion in both unjammed and jammed states, as well as its stiffness under various actuation and jamming conditions. As a result, we provide an optimal jamming policy as a trade-off between preserving the range of motion and maximizing stiffness. The proposed design was further demonstrated in a switch-toggling task, showing its potential for practical applications.

arxiv情報

著者 Yao Yao,Maximilian Westermann,Marco Pontin,Alessandro Albini,Perla Maiolino
発行日 2025-02-05 14:48:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | JAMMit! Monolithic 3D-Printing of a Bead Jamming Soft Pneumatic Arm はコメントを受け付けていません

IRIS: An Immersive Robot Interaction System

要約

このペーパーでは、複数のシミュレータ、ベンチマーク、実際のシナリオにわたってロボットデータ収集と相互作用のために設計された拡張現実(XR)を活用する没入型ロボット相互作用システムであるIRISを紹介します。
既存のXRベースのデータ収集システムは、大規模なデータ収集に効率的かつ直感的なソリューションを提供しますが、多くの場合、再現して再利用するのが困難です。
現在のシステムは、シミュレーター固有のユースケースと環境に高度に調整されているため、この制限が生じます。
Irisは、複数のシミュレータ、ベンチマーク、さらにはヘッドセットをサポートする斬新で簡単に拡張可能なフレームワークです。
さらに、IRISは、深度カメラを介してキャプチャされたポイントクラウドなど、実際のセンサーからの追加情報を含めることができます。
統一されたシーン仕様は、シミュレーターまたは実際のセンサーから直接生成され、XRヘッドセットに送信され、XRで同じシーンが作成されます。
この仕様により、IRISはシミュレータが提供するオブジェクト、アセット、およびロボットのいずれかをサポートできます。
さらに、IRISは、共有された空間アンカーと、複数のXRヘッドセット間のシミュレーションをリンクする堅牢な通信プロトコルを導入します。
この機能により、複数のXRヘッドセットが同期シーンを共有し、共同およびマルチユーザーのデータ収集を促進できます。
IRISは、Unity Frameworkをサポートする任意のデバイスに展開でき、市販のヘッドセットの大部分を網羅しています。
この作業では、IRISがMeta Quest 3とHololens 2で展開され、テストされました。IRISは、Mujoco、Isaacsim、Coppeliasim、および象徴などの現在の人気のロボットシミュレーターを使用して、幅広い現実世界およびシミュレートされたシナリオにわたってその汎用性を紹介しました。

さらに、ユーザー調査では、リベロベンチマークのデータ収集タスクに関するIRISを評価します。
この研究は、虹彩が目的メトリックと主観的なメトリックの両方でベースラインを大幅に上回ることを示しています。

要約(オリジナル)

This paper introduces IRIS, an immersive Robot Interaction System leveraging Extended Reality (XR), designed for robot data collection and interaction across multiple simulators, benchmarks, and real-world scenarios. While existing XR-based data collection systems provide efficient and intuitive solutions for large-scale data collection, they are often challenging to reproduce and reuse. This limitation arises because current systems are highly tailored to simulator-specific use cases and environments. IRIS is a novel, easily extendable framework that already supports multiple simulators, benchmarks, and even headsets. Furthermore, IRIS is able to include additional information from real-world sensors, such as point clouds captured through depth cameras. A unified scene specification is generated directly from simulators or real-world sensors and transmitted to XR headsets, creating identical scenes in XR. This specification allows IRIS to support any of the objects, assets, and robots provided by the simulators. In addition, IRIS introduces shared spatial anchors and a robust communication protocol that links simulations between multiple XR headsets. This feature enables multiple XR headsets to share a synchronized scene, facilitating collaborative and multi-user data collection. IRIS can be deployed on any device that supports the Unity Framework, encompassing the vast majority of commercially available headsets. In this work, IRIS was deployed and tested on the Meta Quest 3 and the HoloLens 2. IRIS showcased its versatility across a wide range of real-world and simulated scenarios, using current popular robot simulators such as MuJoCo, IsaacSim, CoppeliaSim, and Genesis. In addition, a user study evaluates IRIS on a data collection task for the LIBERO benchmark. The study shows that IRIS significantly outperforms the baseline in both objective and subjective metrics.

arxiv情報

著者 Xinkai Jiang,Qihao Yuan,Enes Ulas Dincer,Hongyi Zhou,Ge Li,Xueyin Li,Julius Haag,Nicolas Schreiber,Kailai Li,Gerhard Neumann,Rudolf Lioutikov
発行日 2025-02-05 15:56:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | IRIS: An Immersive Robot Interaction System はコメントを受け付けていません

Contact-Aware Motion Planning Among Movable Objects

要約

モバイルロボットのモーション計画のためのほとんどの既存の方法には、衝突のない軌跡の生成が含まれます。
ただし、接触回避のみに焦点を当てたこれらの方法は、ロボットの移動を制限する可能性があり、接触が避けられない、または意図的なタスクに適用することはできません。
これらの問題に対処するために、ロボットシステムの新しい連絡先認識モーションプランニング(CAMP)パラダイムを提案します。
私たちのアプローチには、最適化ベースの軌跡計画における相補性の制約として、ロボットと可動オブジェクト間の接触が組み込まれています。
拡張されたラグランジアン法(ALMS)を活用することにより、相補性の制約で最適化問題を効率的に解決し、ロボットの空間的最適な軌跡を生成します。
シミュレーションは、最先端の方法と比較して、提案されたCAMP法によりモバイルロボットの到達可能な空間が拡大し、2種類の基本タスクの成功率が大幅に改善されることを示しています。
)および可動オブジェクトの再配置(RAMO)。
実際の実験は、提案された方法によって生成された軌跡が実現可能であり、さまざまなタスクに迅速に展開されていることを示しています。

要約(オリジナル)

Most existing methods for motion planning of mobile robots involve generating collision-free trajectories. However, these methods focusing solely on contact avoidance may limit the robots’ locomotion and can not be applied to tasks where contact is inevitable or intentional. To address these issues, we propose a novel contact-aware motion planning (CAMP) paradigm for robotic systems. Our approach incorporates contact between robots and movable objects as complementarity constraints in optimization-based trajectory planning. By leveraging augmented Lagrangian methods (ALMs), we efficiently solve the optimization problem with complementarity constraints, producing spatial-temporal optimal trajectories of the robots. Simulations demonstrate that, compared to the state-of-the-art method, our proposed CAMP method expands the reachable space of mobile robots, resulting in a significant improvement in the success rate of two types of fundamental tasks: navigation among movable objects (NAMO) and rearrangement of movable objects (RAMO). Real-world experiments show that the trajectories generated by our proposed method are feasible and quickly deployed in different tasks.

arxiv情報

著者 Haokun Wang,Qianhao Wang,Fei Gao,Shaojie Shen
発行日 2025-02-05 16:15:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Contact-Aware Motion Planning Among Movable Objects はコメントを受け付けていません

Implicit Communication in Human-Robot Collaborative Transport

要約

私たちは、ロボットとユーザーがオブジェクトをゴールポーズに協力して移動する人間のロボット共同輸送に焦点を当てています。
明示的なコミュニケーションがない場合、この問題は、非常に異なるセンシング、作動、および推論能力を持っている2人の不均一なエージェント間の緊密な暗黙の調整を必要とするため、困難です。
私たちの重要な洞察は、2つのエージェントが、輸送されたオブジェクトの状態に影響を与える微妙なコミュニケーションシグナルをアクションにエンコードすることにより、流fluentに調整できることです。
この目的のために、2つのエージェントによって実行された共同アクションの観測を、ワークスペーストラバーサルの一連の共同戦略に確率的にマップする推論メカニズムを設計します。
このメカニズムに基づいて、展開する横断戦略に対する人間の不確実性を表すコストを定義し、不確実性の最小化と効率の最大化のバランスをとるモデル予測コントローラーに導入します。
モバイルマニピュレーター(ハローロボットストレッチ)にフレームワークを展開し、被験者内ラボの調査(n = 24)で評価します。
私たちのフレームワークにより、チームのパフォーマンスが向上し、コミュニケーションメカニズムがないベースラインと比較して、ロボットが大幅に流fluentで有能なパートナーとして認識されることを示しています。

要約(オリジナル)

We focus on human-robot collaborative transport, in which a robot and a user collaboratively move an object to a goal pose. In the absence of explicit communication, this problem is challenging because it demands tight implicit coordination between two heterogeneous agents, who have very different sensing, actuation, and reasoning capabilities. Our key insight is that the two agents can coordinate fluently by encoding subtle, communicative signals into actions that affect the state of the transported object. To this end, we design an inference mechanism that probabilistically maps observations of joint actions executed by the two agents to a set of joint strategies of workspace traversal. Based on this mechanism, we define a cost representing the human’s uncertainty over the unfolding traversal strategy and introduce it into a model predictive controller that balances between uncertainty minimization and efficiency maximization. We deploy our framework on a mobile manipulator (Hello Robot Stretch) and evaluate it in a within-subjects lab study (N=24). We show that our framework enables greater team performance and empowers the robot to be perceived as a significantly more fluent and competent partner compared to baselines lacking a communicative mechanism.

arxiv情報

著者 Elvin Yang,Christoforos Mavrogiannis
発行日 2025-02-05 16:39:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Implicit Communication in Human-Robot Collaborative Transport はコメントを受け付けていません