Design and Validation of an Intention-Aware Probabilistic Framework for Trajectory Prediction: Integrating COLREGS, Grounding Hazards, and Planned Routes

要約

衝突回避能力は、自律容器ナビゲーションシステムの重要なコンポーネントです。
この目的のために、動的な障害物の軌跡の正確な予測が不可欠です。
軌跡予測に対する従来のアプローチは、一般化可能性における直面の制限であり、多くの場合、他の船舶の意図を説明できません。
最近の研究では、動的な障害の意図を取り入れることが検討されていますが、これらの努力は通常、状況の独自の船の解釈に基づいています。
この分野の現在の最先端は、複数の根本的な原因を考慮し、異なる船舶による状況の異なる解釈を可能にすることにより、ターゲット容器の意図を推進する動的なベイジアンネットワーク(DBN)モデルです。
ただし、設立以来、このモデルには重要な構造的改善はありませんでした。
この論文では、接地の危険と船舶ウェイポイント情報に関する考慮事項を組み込むことにより、DBNモデルを強化することを提案します。
提案されたモデルは、履歴自動識別システム(AIS)データから抽出された実際の船舶の出会いを使用して検証されます。

要約(オリジナル)

Collision avoidance capability is an essential component in an autonomous vessel navigation system. To this end, an accurate prediction of dynamic obstacle trajectories is vital. Traditional approaches to trajectory prediction face limitations in generalizability and often fail to account for the intentions of other vessels. While recent research has considered incorporating the intentions of dynamic obstacles, these efforts are typically based on the own-ship’s interpretation of the situation. The current state-of-the-art in this area is a Dynamic Bayesian Network (DBN) model, which infers target vessel intentions by considering multiple underlying causes and allowing for different interpretations of the situation by different vessels. However, since its inception, there have not been any significant structural improvements to this model. In this paper, we propose enhancing the DBN model by incorporating considerations for grounding hazards and vessel waypoint information. The proposed model is validated using real vessel encounters extracted from historical Automatic Identification System (AIS) data.

arxiv情報

著者 Dhanika Mahipala,Trym Tengesdal,Børge Rokseth,Tor Arne Johansen
発行日 2025-06-11 08:20:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Design and Validation of an Intention-Aware Probabilistic Framework for Trajectory Prediction: Integrating COLREGS, Grounding Hazards, and Planned Routes はコメントを受け付けていません

Efficient Preference-Based Reinforcement Learning: Randomized Exploration Meets Experimental Design

要約

一般的なマルコフ決定プロセスでの人間のフィードバックからの強化学習を研究します。そこでは、エージェントが軌道レベルの好みの比較から学習します。
この設定の中心的な課題は、理論的保証を保証しながら、基礎となる報酬を特定するための有益な優先順位クエリを選択するアルゴリズムを設計することです。
ランダム化された探査に基づいたメタアルゴリズムを提案します。これは、楽観的なアプローチに関連する計算上の課題を回避し、扱いやすいままです。
軽度の強化学習オラクルの仮定の下で、後悔と最終標的の両方の保証を確立します。
クエリの複雑さを改善するために、軌道ペアのバッチを収集し、最適な実験設計を適用して有益な比較クエリを選択する改善されたアルゴリズムを導入および分析します。
また、バッチ構造により、フィードバックを同時に収集できるため、実際の展開に関連する優先クエリの並列化も可能になります。
実証的評価は、提案された方法が少数の優先クエリを必要とする一方で、報酬ベースの強化学習と競争力があることを確認します。

要約(オリジナル)

We study reinforcement learning from human feedback in general Markov decision processes, where agents learn from trajectory-level preference comparisons. A central challenge in this setting is to design algorithms that select informative preference queries to identify the underlying reward while ensuring theoretical guarantees. We propose a meta-algorithm based on randomized exploration, which avoids the computational challenges associated with optimistic approaches and remains tractable. We establish both regret and last-iterate guarantees under mild reinforcement learning oracle assumptions. To improve query complexity, we introduce and analyze an improved algorithm that collects batches of trajectory pairs and applies optimal experimental design to select informative comparison queries. The batch structure also enables parallelization of preference queries, which is relevant in practical deployment as feedback can be gathered concurrently. Empirical evaluation confirms that the proposed method is competitive with reward-based reinforcement learning while requiring a small number of preference queries.

arxiv情報

著者 Andreas Schlaginhaufen,Reda Ouhamma,Maryam Kamgarpour
発行日 2025-06-11 08:27:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO, stat.ML | Efficient Preference-Based Reinforcement Learning: Randomized Exploration Meets Experimental Design はコメントを受け付けていません

How attention simplifies mental representations for planning

要約

人間の計画は効率的であり、困難なタスクを達成するために限られた認知リソースを展開し、柔軟な新しい問題や環境に適応します。
計算アプローチは、人々が環境の単純化された精神的表現を構築し、タスク表現の複雑さとその有用性のバランスをとることを示唆しています。
これらのモデルは、計画が知覚を形成し、知覚が計画を形成するネストされた最適化を意味しますが、この相互作用がどのように展開するかを管理する知覚的および注意メカニズムは不明のままです。
ここでは、仮想迷路のナビゲーションを活用して、空間的注意がタスク表現のどの側面が主観的な認識に入り、計画に利用できるかを特徴付ける。
空間的近接性は、迷路のどの側面が計画に利用できるかを支配し、タスク関連の情報が自然な(横にされた)注意の輪郭に続く場合、人々はより簡単に単純化された有用な迷路表現を構築できることがわかります。
この注意の影響は、個人によって大きく異なり、人々のタスク表現と行動の違いを説明します。
「注意のスポットライト」の類推に触発されて、視覚空間の注意の影響を価値誘導解釈の既存の計算アカウントに組み込みます。
一緒に、私たちの仕事は、個人が計画の助けを借りて環境をどのように表現するかをよりよく理解するために、認識と意思決定に関する計算の視点を橋渡しします。

要約(オリジナル)

Human planning is efficient — it frugally deploys limited cognitive resources to accomplish difficult tasks — and flexible — adapting to novel problems and environments. Computational approaches suggest that people construct simplified mental representations of their environment, balancing the complexity of a task representation with its utility. These models imply a nested optimisation in which planning shapes perception, and perception shapes planning — but the perceptual and attentional mechanisms governing how this interaction unfolds remain unknown. Here, we harness virtual maze navigation to characterise how spatial attention controls which aspects of a task representation enter subjective awareness and are available for planning. We find that spatial proximity governs which aspects of a maze are available for planning, and that when task-relevant information follows natural (lateralised) contours of attention, people can more easily construct simplified and useful maze representations. This influence of attention varies considerably across individuals, explaining differences in people’s task representations and behaviour. Inspired by the ‘spotlight of attention’ analogy, we incorporate the effects of visuospatial attention into existing computational accounts of value-guided construal. Together, our work bridges computational perspectives on perception and decision-making to better understand how individuals represent their environments in aid of planning.

arxiv情報

著者 Jason da Silva Castanheira,Nicholas Shea,Stephen M. Fleming
発行日 2025-06-11 08:46:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO, q-bio.NC | How attention simplifies mental representations for planning はコメントを受け付けていません

Adaptive event-triggered robust tracking control of soft robots

要約

柔軟な材料で製造されたソフトロボットは、非常に準拠し、周囲に適応することができ、器用な操作や環境探査などの分野でのアプリケーションを促進します。
このペーパーは、モデルのダイナミクスや外乱などの不確実性の下で、ソフトロボットの追跡制御問題を調査することを目的としています。
まず、新しいスイッチング関数を確立し、コマンドフィルターにより補償された追跡エラーダイナミクスを設計します。
次に、バックステップの方法論に基づいて、仮想コントローラーと不確実性の影響の最高を推定する適応ロジックは、イベントトリガーされた制御戦略を合成するために開発されます。
さらに、均一な有限時間安定性認証は、スイッチング関数のさまざまなシナリオに対して導出されます。
最後に、提案されたコントロールアルゴリズムの有効性を説明するために、ソフトロボットのケーススタディを実行します。

要約(オリジナル)

Soft robots manufactured with flexible materials can be highly compliant and adaptive to their surroundings, which facilitates their application in areas such as dexterous manipulation and environmental exploration. This paper aims at investigating the tracking control problem for soft robots under uncertainty such as unmodeled dynamics and external disturbance. First, we establish a novel switching function and design the compensated tracking error dynamics by virtue of the command filter. Then, based on the backstepping methodology, the virtual controllers and the adaptive logic estimating the supremum of uncertainty impacts are developed for synthesizing an event-triggered control strategy. In addition, the uniformed finite-time stability certification is derived for different scenarios of the switching function. Finally, we perform a case study of a soft robot to illustrate the effectiveness of the proposed control algorithm.

arxiv情報

著者 Renjie Ma,Ziyao Qu,Zhijian Hu,Dong Zhao,Marios M. Polycarpou
発行日 2025-06-11 08:47:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Adaptive event-triggered robust tracking control of soft robots はコメントを受け付けていません

Tightly-Coupled LiDAR-IMU-Leg Odometry with Online Learned Leg Kinematics Incorporating Foot Tactile Information

要約

この手紙では、lidar-imu-legの密着した密着性のある臭気測定を提示します。これは、特徴のない環境や変形可能な地形などの挑戦的な状況に堅牢です。
私たちは、ロボットの足と地面の間の非線形ダイナミクスを暗黙的に表現するために触覚情報(足反応力)を組み込んだニューラルレッグキネマティクスモデルという名前のオンライン学習ベースの脚の運動学モデルを開発しました。
このモデルのオンライントレーニングは、ロボットの重量負荷変化(たとえば、配信または輸送タスクを想定する)および地形条件に対する適応性を高めます。
\ textIT {Neural Adaptive Leg odometry因子}および脚の運動学モデルベースのモーション予測のオンライン不確実性推定によれば、この運動モデルのオンライントレーニングと統一因子グラフの匂い測定推定を共同で解決して、両方の一貫性を保持します。
提案された方法は、2つの挑戦的な状況で四足動物のロボットを使用した実際の実験を通じて検証されました。1)変形可能な地形を持つ非常に特徴のないエリアを表す砂浜、および2)複数の特徴のないエリアと地形のアスファルト、砂利(変形可能な地形)、草を含むキャンパス。
実験結果は、\ textIT {Neural Leg Kinematics Model}を組み込んだodoMetry推定が最新作業を上回ることを示しました。
プロジェクトページの詳細については、https://takuokawara.github.io/ral2025_project_page/をご覧ください。

要約(オリジナル)

In this letter, we present tightly coupled LiDAR-IMU-leg odometry, which is robust to challenging conditions such as featureless environments and deformable terrains. We developed an online learning-based leg kinematics model named the neural leg kinematics model, which incorporates tactile information (foot reaction force) to implicitly express the nonlinear dynamics between robot feet and the ground. Online training of this model enhances its adaptability to weight load changes of a robot (e.g., assuming delivery or transportation tasks) and terrain conditions. According to the \textit{neural adaptive leg odometry factor} and online uncertainty estimation of the leg kinematics model-based motion predictions, we jointly solve online training of this kinematics model and odometry estimation on a unified factor graph to retain the consistency of both. The proposed method was verified through real experiments using a quadruped robot in two challenging situations: 1) a sandy beach, representing an extremely featureless area with a deformable terrain, and 2) a campus, including multiple featureless areas and terrain types of asphalt, gravel (deformable terrain), and grass. Experimental results showed that our odometry estimation incorporating the \textit{neural leg kinematics model} outperforms state-of-the-art works. Our project page is available for further details: https://takuokawara.github.io/RAL2025_project_page/

arxiv情報

著者 Taku Okawara,Kenji Koide,Aoki Takanose,Shuji Oishi,Masashi Yokozuka,Kentaro Uno,Kazuya Yoshida
発行日 2025-06-11 09:28:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO | Tightly-Coupled LiDAR-IMU-Leg Odometry with Online Learned Leg Kinematics Incorporating Foot Tactile Information はコメントを受け付けていません

Enhancing Human-Robot Collaboration: A Sim2Real Domain Adaptation Algorithm for Point Cloud Segmentation in Industrial Environments

要約

3D環境の堅牢な解釈は、安全性と運用効率が最重要であるヒューマンロボットコラボレーション(HRC)アプリケーションに不可欠です。
セマンティックセグメンテーションは、環境の正確で詳細な理解を可能にすることにより、このコンテキストで重要な役割を果たします。
効果的なセマンティックセグメンテーションに不可欠な実際の産業用注釈データに対する激しいデータの飢えを考慮して、このペーパーでは、HRC専用に調整された3DポイントクラウドデータのセマンティックセグメンテーションのためのSIM2REALドメイン適応における先駆的なアプローチを紹介します。
私たちの焦点は、シミュレートされた環境から現実世界のアプリケーションに堅牢に移行するネットワークを開発し、それにより、その実用的な有用性と安全なHRCへの影響を高めることにあります。
この作業では、動的グラフ畳み込みニューラルネットワーク(DGCNN)と畳み込みニューラルネットワーク(CNN)を組み合わせたデュアルストリームネットワークアーキテクチャ(融合)を提案します。
提案されたモデルは、実際のHRCセットアップとシミュレーション産業点クラウドで評価され、最先端のパフォーマンスの増加を示し、既存の方法と比較して97.76%のセグメンテーション精度と優れた堅牢性を達成しました。

要約(オリジナル)

The robust interpretation of 3D environments is crucial for human-robot collaboration (HRC) applications, where safety and operational efficiency are paramount. Semantic segmentation plays a key role in this context by enabling a precise and detailed understanding of the environment. Considering the intense data hunger for real-world industrial annotated data essential for effective semantic segmentation, this paper introduces a pioneering approach in the Sim2Real domain adaptation for semantic segmentation of 3D point cloud data, specifically tailored for HRC. Our focus is on developing a network that robustly transitions from simulated environments to real-world applications, thereby enhancing its practical utility and impact on a safe HRC. In this work, we propose a dual-stream network architecture (FUSION) combining Dynamic Graph Convolutional Neural Networks (DGCNN) and Convolutional Neural Networks (CNN) augmented with residual layers as a Sim2Real domain adaptation algorithm for an industrial environment. The proposed model was evaluated on real-world HRC setups and simulation industrial point clouds, it showed increased state-of-the-art performance, achieving a segmentation accuracy of 97.76%, and superior robustness compared to existing methods.

arxiv情報

著者 Fatemeh Mohammadi Amin,Darwin G. Caldwell,Hans Wernher van de Venn
発行日 2025-06-11 09:36:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | Enhancing Human-Robot Collaboration: A Sim2Real Domain Adaptation Algorithm for Point Cloud Segmentation in Industrial Environments はコメントを受け付けていません

Reactive and Safety-Aware Path Replanning for Collaborative Applications

要約

このペーパーでは、人間とロボットの共同シナリオで動きを再繰り返し、反応性と安全に準拠した効率を強調します。
既存の人的認識モーションプランナーは構造化された環境で効果的ですが、多くの場合、予測不可能な人間の行動に苦労し、ロボットのパフォーマンスとスループットを制限する安全対策につながります。
この研究では、リアクティブパス再生と安全性の認識コスト関数を組み合わせて、ロボットが人間の状態の変化へのパスを調整できるようにします。
このソリューションは、安全性を犠牲にすることなく、実行時間と軌跡の減速の必要性を短縮します。
シミュレーションと現実世界の実験は、最大60 \%の効率向上を伴う、標準的なヒトロボット協力アプローチと比較した方法の有効性を示しています。

要約(オリジナル)

This paper addresses motion replanning in human-robot collaborative scenarios, emphasizing reactivity and safety-compliant efficiency. While existing human-aware motion planners are effective in structured environments, they often struggle with unpredictable human behavior, leading to safety measures that limit robot performance and throughput. In this study, we combine reactive path replanning and a safety-aware cost function, allowing the robot to adjust its path to changes in the human state. This solution reduces the execution time and the need for trajectory slowdowns without sacrificing safety. Simulations and real-world experiments show the method’s effectiveness compared to standard human-robot cooperation approaches, with efficiency enhancements of up to 60\%.

arxiv情報

著者 Cesare Tonola,Marco Faroni,Saeed Abdolshah,Mazin Hamad,Sami Haddadin,Nicola Pedrocchi,Manuel Beschi
発行日 2025-06-11 10:09:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Reactive and Safety-Aware Path Replanning for Collaborative Applications はコメントを受け付けていません

Integrating Quantized LLMs into Robotics Systems as Edge AI to Leverage their Natural Language Processing Capabilities

要約

大規模な言語モデル(LLMS)は昨年、大きな進歩を経験し、いくつかの分野でこれらのモデルが増加して自然言語のタスクに直面しています。
ロボット工学でのこれらのモデルの統合は、人間とロボットの相互作用、ナビゲーション、計画、意思決定など、いくつかの側面を改善するのにも役立ちます。
したがって、このペーパーでは、Llama \ _ROSを紹介します。Llama\ _Rosは、llama.cppを使用して量子化された大手言語モデル(LLMS)をロボットシステムに統合するために設計されたツールであり、Llama.cppをレバレッジしているラマ\ _ROSを使用して、エッジエッジの人工知能としてのロボットシステムでのロボットシステムでのロボットシステムにおいて、エッジエッジエフェクティックシステムとしての量子化LLMS(AI)としての量子化LLMの効率的な実行を可能にします。
量子化されたLLMSを展開することにより、llama \ _ROSは、自律ロボットの機能を改善するために、迅速なエンジニアリング、知識グラフ、オントロジー、またはその他のツールと組み合わせることができる強化された意思決定と相互作用のために、自然言語の理解と生成を活用するためにロボットを強化します。
さらに、このペーパーでは、ロボット工学の計画と説明可能性のためにllama \ _ROSを使用するいくつかのユースケースに関する洞察を提供します。

要約(オリジナル)

Large Language Models (LLMs) have experienced great advancements in the last year resulting in an increase of these models in several fields to face natural language tasks. The integration of these models in robotics can also help to improve several aspects such as human-robot interaction, navigation, planning and decision-making. Therefore, this paper introduces llama\_ros, a tool designed to integrate quantized Large Language Models (LLMs) into robotic systems using ROS 2. Leveraging llama.cpp, a highly optimized runtime engine, llama\_ros enables the efficient execution of quantized LLMs as edge artificial intelligence (AI) in robotics systems with resource-constrained environments, addressing the challenges of computational efficiency and memory limitations. By deploying quantized LLMs, llama\_ros empowers robots to leverage the natural language understanding and generation for enhanced decision-making and interaction which can be paired with prompt engineering, knowledge graphs, ontologies or other tools to improve the capabilities of autonomous robots. Additionally, this paper provides insights into some use cases of using llama\_ros for planning and explainability in robotics.

arxiv情報

著者 Miguel Á. González-Santamarta,Francisco J. Rodríguez-Lera,David Sobrín-Hidalgo,Ángel Manuel Guerrero-Higueras,Vicente MatellÁn-Olivera
発行日 2025-06-11 10:19:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Integrating Quantized LLMs into Robotics Systems as Edge AI to Leverage their Natural Language Processing Capabilities はコメントを受け付けていません

VAULT: A Mobile Mapping System for ROS 2-based Autonomous Robots

要約

ローカリゼーションは、自律的なロボットのナビゲーション機能において重要な役割を果たします。また、屋内環境は、ホイール臭気と2Dライダーベースのマッピング、農業や林業などの屋外設定に依存することができますが、リアルタイムのローカリゼーションと一貫したマッピングを必要とするユニークな課題を提示します。
このニーズに対処すると、このペーパーでは、さまざまなセンサーを組み合わせて堅牢な屋外および屋内ローカリゼーションを可能にするROS 2ベースのモバイルマッピングシステム(MMS)であるVault Prototypeを紹介します。
提案されたソリューションは、グローバルナビゲーション衛星システム(GNSS)データ、視覚介護臭気(VIO)、慣性測定ユニット(IMU)データ、および拡張カルマンフィルター(EKF)のパワーを活用して、信頼できる3D臭素測定を生成します。
ローカリゼーションの精度をさらに強化するために、Visual Slam(VSLAM)が採用され、包括的な3Dポイントクラウドマップが作成されます。
これらのセンサー技術と高度なアルゴリズムを活用することにより、プロトタイプは自律モバイルロボットにおける屋外ローカリゼーションの包括的なソリューションを提供し、自信と精度で周囲をナビゲートしてマッピングできるようにします。

要約(オリジナル)

Localization plays a crucial role in the navigation capabilities of autonomous robots, and while indoor environments can rely on wheel odometry and 2D LiDAR-based mapping, outdoor settings such as agriculture and forestry, present unique challenges that necessitate real-time localization and consistent mapping. Addressing this need, this paper introduces the VAULT prototype, a ROS 2-based mobile mapping system (MMS) that combines various sensors to enable robust outdoor and indoor localization. The proposed solution harnesses the power of Global Navigation Satellite System (GNSS) data, visual-inertial odometry (VIO), inertial measurement unit (IMU) data, and the Extended Kalman Filter (EKF) to generate reliable 3D odometry. To further enhance the localization accuracy, Visual SLAM (VSLAM) is employed, resulting in the creation of a comprehensive 3D point cloud map. By leveraging these sensor technologies and advanced algorithms, the prototype offers a comprehensive solution for outdoor localization in autonomous mobile robots, enabling them to navigate and map their surroundings with confidence and precision.

arxiv情報

著者 Miguel Á. González-Santamarta,Francisco J. Rodríguez-Lera,Vicente Matellán-Olivera
発行日 2025-06-11 10:26:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | VAULT: A Mobile Mapping System for ROS 2-based Autonomous Robots はコメントを受け付けていません

Attention-Based Map Encoding for Learning Generalized Legged Locomotion

要約

脚のロボットの動的な移動は、モバイルロボットの運用範囲を拡大する上で重要でありながら挑戦的なトピックです。
可能性のある足場がまばらであり、不確実性や障害に対する堅牢性、および多様な地形全体の一般化可能性がある場合、正確な計画が必要です。
従来のモデルベースのコントローラーは、複雑な地形の計画に優れていますが、実際の不確実性と格闘しています。
学習ベースのコントローラーは、そのような不確実性に堅牢性を提供しますが、段階的な領域がまばらな地形の正確さを欠いていることがよくあります。
ハイブリッド方法は、両方の方法を組み合わせることにより、まばらな地形の堅牢性の向上を実現しますが、モデルベースのプランナーの固有の制限によって計算的に要求され、制約されています。
学習ベースのコントローラーの堅牢性を維持しながら、多様な地形で一般化された脚のある脚の移動を達成するために、このペーパーでは、強化学習を使用してエンドツーエンドコントローラーの一部として訓練されているロボット固有受容を条件とする注意ベースのマップエンコードを学習することを提案します。
ロボットが多様で挑戦的な地形を動的にナビゲートするときに、ネットワークが将来の足場の段階的なエリアに焦点を合わせることを学ぶことを示します。
私たちは、まばらな地形の正確で機敏な横断を可能にしながら、不確実性に対して堅牢性を示す行動を合成します。
さらに、この方法では、ニューラルネットワークの地形認識を解釈する方法を提供します。
12ドーフのQuadrupedalロボットと23ドフのヒューマノイドロボットの2つのコントローラーをそれぞれトレーニングし、トレーニング中に見えないものを含むさまざまな挑戦的な屋内および屋外シナリオの下で、現実世界の結果として得られるコントローラーをテストしました。

要約(オリジナル)

Dynamic locomotion of legged robots is a critical yet challenging topic in expanding the operational range of mobile robots. It requires precise planning when possible footholds are sparse, robustness against uncertainties and disturbances, and generalizability across diverse terrains. While traditional model-based controllers excel at planning on complex terrains, they struggle with real-world uncertainties. Learning-based controllers offer robustness to such uncertainties but often lack precision on terrains with sparse steppable areas. Hybrid methods achieve enhanced robustness on sparse terrains by combining both methods but are computationally demanding and constrained by the inherent limitations of model-based planners. To achieve generalized legged locomotion on diverse terrains while preserving the robustness of learning-based controllers, this paper proposes to learn an attention-based map encoding conditioned on robot proprioception, which is trained as part of the end-to-end controller using reinforcement learning. We show that the network learns to focus on steppable areas for future footholds when the robot dynamically navigates diverse and challenging terrains. We synthesize behaviors that exhibit robustness against uncertainties while enabling precise and agile traversal of sparse terrains. Additionally, our method offers a way to interpret the topographical perception of a neural network. We have trained two controllers for a 12-DoF quadrupedal robot and a 23-DoF humanoid robot respectively and tested the resulting controllers in the real world under various challenging indoor and outdoor scenarios, including ones unseen during training.

arxiv情報

著者 Junzhe He,Chong Zhang,Fabian Jenelten,Ruben Grandia,Moritz BÄcher,Marco Hutter
発行日 2025-06-11 10:38:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Attention-Based Map Encoding for Learning Generalized Legged Locomotion はコメントを受け付けていません