Two is Better Than One: Digital Siblings to Improve Autonomous Driving Testing

要約

シミュレーションベースのテストは、自動運転ソフトウェアの信頼性を確保するための重要なステップとなります。
実際、企業が社内テストまたは外部委託テストでサードパーティの汎用シミュレータに依存する場合、テスト結果を実際の自動運転車に一般化できるかどうかが危険にさらされます。
このペーパーでは、デジタル 兄弟の概念を導入することでシミュレーション ベースのテストを強化します。これは、異なるテクノロジで構築された複数の汎用シミュレータ上で特定の自動運転車をテストするマルチ シミュレータ アプローチであり、テスト プロセスにおいてアンサンブルとして集合的に動作します。

自動運転車の車線維持コンポーネントのテストに焦点を当てたケーススタディで、当社のアプローチを例示します。
私たちは 2 つのオープンソース シミュレーターをデジタルの兄弟として使用し、このようなマルチ シミュレーターのアプローチを、大規模なテスト ケースで物理的にスケールされた自動運転車のデジタル ツインと実証的に比較します。
私たちのアプローチでは、道路ポイントのシーケンスの形式で、個々のシミュレーターごとにテスト ケースを生成して実行する必要があります。
次に、機能マップを使用して、テスト ケースがシミュレーター間で移行され、練習された運転条件が特徴付けられます。
最後に、共同で予測される故障確率が計算され、兄弟間で一致した場合にのみ故障が報告されます。
私たちの経験的評価は、デジタル兄弟によるアンサンブル障害予測器が、デジタルツインの障害予測において個々のシミュレータよりも優れていることを示しています。
私たちのケーススタディの結果について説明し、私たちのアプローチが自動運転ソフトウェアの自動テストに関心のある研究者にどのように役立つかを詳しく説明します。

要約(オリジナル)

Simulation-based testing represents an important step to ensure the reliability of autonomous driving software. In practice, when companies rely on third-party general-purpose simulators, either for in-house or outsourced testing, the generalizability of testing results to real autonomous vehicles is at stake. In this paper, we enhance simulation-based testing by introducing the notion of digital siblings, a multi-simulator approach that tests a given autonomous vehicle on multiple general-purpose simulators built with different technologies, that operate collectively as an ensemble in the testing process. We exemplify our approach on a case study focused on testing the lane-keeping component of an autonomous vehicle. We use two open-source simulators as digital siblings, and we empirically compare such a multi-simulator approach against a digital twin of a physical scaled autonomous vehicle on a large set of test cases. Our approach requires generating and running test cases for each individual simulator, in the form of sequences of road points. Then, test cases are migrated between simulators, using feature maps to characterize the exercised driving conditions. Finally, the joint predicted failure probability is computed, and a failure is reported only in cases of agreement among the siblings. Our empirical evaluation shows that the ensemble failure predictor by the digital siblings is superior to each individual simulator at predicting the failures of the digital twin. We discuss the findings of our case study and detail how our approach can help researchers interested in automated testing of autonomous driving software.

arxiv情報

著者 Matteo Biagiola,Andrea Stocco,Vincenzo Riccio,Paolo Tonella
発行日 2024-10-09 09:14:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO, cs.SE, D.2.5 | コメントする

PointNetPGAP-SLC: A 3D LiDAR-based Place Recognition Approach with Segment-level Consistency Training for Mobile Robots in Horticulture

要約

3D LiDAR ベースの場所認識は、レーザー光線に対して半透過性であるため、独特の課題を抱えている園芸環境では依然としてほとんど研究されていません。
この特性により、多くの場合、隣接する行からの LiDAR スキャンが非常に類似する結果となり、記述子のあいまいさが生じ、その結果、検索パフォーマンスが低下します。
この研究では、園芸環境における 3D LiDAR の場所認識の課題に対処し、特に 3 つの重要な貢献を導入することで列間のあいまいさに焦点を当てます: (i) 統計的にインスピレーションを得た 2 つのアグリゲーターの出力を組み合わせた新しいモデル PointNetPGAP
単一の記述子。
(ii) セグメントレベルの一貫性 (SLC) モデル。記述子の堅牢性を高めるためにトレーニング中にのみ使用されます。
(iii) 果樹園とイチゴ畑からの LiDAR シーケンスを含む、HORTO-3DLM データセット。
HORTO-3DLM および KITTI オドメトリ データセットに対して行われた実験評価では、特に SLC モデルが適用された場合に、PointNetPGAP が OverlapTransformer や PointNetVLAD などの最先端のモデルよりも優れたパフォーマンスを発揮することが実証されています。
これらの結果は、曖昧性の高いセグメントでの検索パフォーマンスを大幅に向上させることにより、特に園芸環境においてこのモデルの優位性を強調しています。

要約(オリジナル)

3D LiDAR-based place recognition remains largely underexplored in horticultural environments, which present unique challenges due to their semi-permeable nature to laser beams. This characteristic often results in highly similar LiDAR scans from adjacent rows, leading to descriptor ambiguity and, consequently, compromised retrieval performance. In this work, we address the challenges of 3D LiDAR place recognition in horticultural environments, particularly focusing on inter-row ambiguity by introducing three key contributions: (i) a novel model, PointNetPGAP, which combines the outputs of two statistically-inspired aggregators into a single descriptor; (ii) a Segment-Level Consistency (SLC) model, used exclusively during training to enhance descriptor robustness; and (iii) the HORTO-3DLM dataset, comprising LiDAR sequences from orchards and strawberry fields. Experimental evaluations conducted on the HORTO-3DLM and KITTI Odometry datasets demonstrate that PointNetPGAP outperforms state-of-the-art models, including OverlapTransformer and PointNetVLAD, particularly when the SLC model is applied. These results underscore the model’s superiority, especially in horticultural environments, by significantly improving retrieval performance in segments with higher ambiguity.

arxiv情報

著者 T. Barros,L. Garrote,P. Conde,M. J. Coombes,C. Liu,C. Premebida,U. J. Nunes
発行日 2024-10-09 09:29:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | コメントする

Collective perception for tracking people with a robot swarm

要約

群れの知覚とは、ロボットの群れが個々のロボットの知覚能力を利用して、環境についての集合的な理解を形成する能力を指します。
その分散型の性質により、ロボット群は空間全体に一定の存在を維持することで動的環境を継続的に監視することができます。この研究では、ロボット群を使用した人々の集団追跡に関する予備実験を紹介します。
この実験は、さまざまなサイズの群れを含む 4 つの異なるオフィス環境にわたるシミュレーションで実施されました。
ロボットには、現実世界のオフィス環境の写真のデータセットからサンプリングされた画像が提供されました。私たちは、ロボットが場所を変える人を検出し、その情報を群れの一部に伝播するのに必要な時間分布を測定しました。
この結果は、ロボット群が動的環境の監視において大きな可能性を示していることを示しています。

要約(オリジナル)

Swarm perception refers to the ability of a robot swarm to utilize the perception capabilities of each individual robot, forming a collective understanding of the environment. Their distributed nature enables robot swarms to continuously monitor dynamic environments by maintaining a constant presence throughout the space.In this study, we present a preliminary experiment on the collective tracking of people using a robot swarm. The experiment was conducted in simulation across four different office environments, with swarms of varying sizes. The robots were provided with images sampled from a dataset of real-world office environment pictures.We measured the time distribution required for a robot to detect a person changing location and to propagate this information to increasing fractions of the swarm. The results indicate that robot swarms show significant promise in monitoring dynamic environments.

arxiv情報

著者 Miquel Kegeleirs,David Garzón Ramos,Guillermo Legarda Herranz,Ilyes Gharbi,Jeanne Szpirer,Olivier Debeir,Ken Hasselmann,Lorenzo Garattoni,Gianpiero Francesca,Mauro Birattari
発行日 2024-10-09 09:43:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | コメントする

Discrete time model predictive control for humanoid walking with step adjustment

要約

この論文では、オンライン足音調整を備えたヒューマノイド歩行のための離散時間モデル予測コントローラー (MPC) を紹介します。
提案されたコントローラは階層制御アプローチを利用します。
高レベルのコントローラーは、低次元の線形倒立振子モデル (LIPM) を使用して、望ましい足の位置と重心 (CoM) の動きを決定し、望ましい速度を維持しながら転倒を防止します。
次に、タスク スペース コントローラー (TSC) が、上位コントローラーから取得した目的の動きを追跡し、ヒューマノイドの全身ダイナミクスを利用します。
私たちのアプローチは、事前に定義されたフットプランや参照圧力中心 (CoP) 軌道に依存しないという点で、歩行パターン生成のための既存の MPC 手法とは異なります。
全体的なアプローチは、トルク制御されたヒューマノイド ロボットのシミュレーションでテストされます。
結果は、提案された制御アプローチが安定した歩行を生成し、押しの外乱に対する転倒を防止することを示しています。

要約(オリジナル)

This paper presents a Discrete-Time Model Predictive Controller (MPC) for humanoid walking with online footstep adjustment. The proposed controller utilizes a hierarchical control approach. The high-level controller uses a low-dimensional Linear Inverted Pendulum Model (LIPM) to determine desired foot placement and Center of Mass (CoM) motion, to prevent falls while maintaining the desired velocity. A Task Space Controller (TSC) then tracks the desired motion obtained from the high-level controller, exploiting the whole-body dynamics of the humanoid. Our approach differs from existing MPC methods for walking pattern generation by not relying on a predefined foot-plan or a reference center of pressure (CoP) trajectory. The overall approach is tested in simulation on a torque-controlled Humanoid Robot. Results show that proposed control approach generates stable walking and prevents fall against push disturbances.

arxiv情報

著者 Vishnu Joshi,Suraj Kumar,Nithin V,Shishir Kolathaya
発行日 2024-10-09 11:40:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | コメントする

Hi-SLAM: Scaling-up Semantics in SLAM with a Hierarchically Categorical Gaussian Splatting

要約

我々は、新しい階層的カテゴリ表現を特徴とするセマンティック 3D ガウス スプラッティング SLAM 手法である Hi-SLAM を提案します。これにより、3D 世界での正確なグローバル 3D セマンティック マッピング、スケールアップ機能、および明示的なセマンティック ラベル予測が可能になります。
セマンティック SLAM システムでのパラメータの使用量は、環境の複雑さが増すにつれて大幅に増加しており、シーンの理解が特に困難でコストがかかるものになっています。
この問題に対処するために、大規模言語モデル (LLM) の機能を活用して、コンパクトな形式でセマンティック情報を 3D ガウス スプラッティングにエンコードする新しい階層表現を導入します。
さらに、レベル間最適化とレベル間最適化の両方を通じて階層的意味論的情報を最適化するように設計された新しい意味論的損失を導入します。
さらに、SLAM システム全体を強化し、トラッキングとマッピングのパフォーマンスを向上させました。
当社の Hi-SLAM は、マッピング精度と追跡精度の両方で既存の高密度 SLAM 方式を上回り、2 倍の動作速度向上を達成します。
さらに、ストレージとトレーニング時間の要件を大幅に削減しながら、小さな合成シーンでセマンティック セグメンテーションをレンダリングする際に優れたパフォーマンスを発揮します。
レンダリング FPS は、セマンティック情報を使用すると 2,000、セマンティック情報を使用しない場合は 3,000 に見事に達します。
最も注目すべきは、500 を超えるセマンティック クラスを使用して複雑な現実世界のシーンを処理する機能を示し、その貴重なスケールアップ機能を強調していることです。

要約(オリジナル)

We propose Hi-SLAM, a semantic 3D Gaussian Splatting SLAM method featuring a novel hierarchical categorical representation, which enables accurate global 3D semantic mapping, scaling-up capability, and explicit semantic label prediction in the 3D world. The parameter usage in semantic SLAM systems increases significantly with the growing complexity of the environment, making it particularly challenging and costly for scene understanding. To address this problem, we introduce a novel hierarchical representation that encodes semantic information in a compact form into 3D Gaussian Splatting, leveraging the capabilities of large language models (LLMs). We further introduce a novel semantic loss designed to optimize hierarchical semantic information through both inter-level and cross-level optimization. Furthermore, we enhance the whole SLAM system, resulting in improved tracking and mapping performance. Our Hi-SLAM outperforms existing dense SLAM methods in both mapping and tracking accuracy, while achieving a 2x operation speed-up. Additionally, it exhibits competitive performance in rendering semantic segmentation in small synthetic scenes, with significantly reduced storage and training time requirements. Rendering FPS impressively reaches 2,000 with semantic information and 3,000 without it. Most notably, it showcases the capability of handling the complex real-world scene with more than 500 semantic classes, highlighting its valuable scaling-up capability.

arxiv情報

著者 Boying Li,Zhixi Cai,Yuan-Fang Li,Ian Reid,Hamid Rezatofighi
発行日 2024-10-09 11:48:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | コメントする

Dynamic Neural Potential Field: Online Trajectory Optimization in Presence of Moving Obstacles

要約

静的および動的障害物が存在する場合の移動ロボットの局所的な軌道計画のタスクに取り組みます。
ローカル軌道は、モデル予測制御 (MPC) 問題の数値解として取得されます。
衝突回避は、障害物の反発力を MPC のコスト関数に追加することによって実現できます。
私たちは、神経モデルによって斥力の可能性を推定するアプローチを開発します。
動的障害物に対処する 3 つの可能な戦略を提案し、検討します。
まず、動的な障害物のある環境を一連の静的な環境として考えます。
第二に、神経モデルは一連の反発ポテンシャルを一度に予測します。
第三に、ニューラル モデルは、自己回帰モードで将来の反発力の可能性を段階的に予測します。
これらの戦略を実装し、BenchMR フレームワークを使用して CIAO* および MPPI と比較します。
最初の 2 つの戦略は、安全上の制約を維持しながら、CIAO* および MPPI よりも高いパフォーマンスを示しました。
3 番目の戦略は少し時間がかかりましたが、それでも時間制限は満たしています。
私たちは、提案された MPC ローカル軌道プランナーの下でオフィスの廊下を移動する Husky UGV モバイル プラットフォームにアプローチを展開します。
コードとトレーニング済みモデルは \url{https://github.com/CognitiveAISystems/Dynamic-Neural-Potential-Field} で入手できます。

要約(オリジナル)

We address a task of local trajectory planning for the mobile robot in the presence of static and dynamic obstacles. Local trajectory is obtained as a numerical solution of the Model Predictive Control (MPC) problem. Collision avoidance may be provided by adding repulsive potential of the obstacles to the cost function of MPC. We develop an approach, where repulsive potential is estimated by the neural model. We propose and explore three possible strategies of handling dynamic obstacles. First, environment with dynamic obstacles is considered as a sequence of static environments. Second, the neural model predict a sequence of repulsive potential at once. Third, the neural model predict future repulsive potential step by step in autoregressive mode. We implement these strategies and compare it with CIAO* and MPPI using BenchMR framework. First two strategies showed higher performance than CIAO* and MPPI while preserving safety constraints. The third strategy was a bit slower, however it still satisfy time limits. We deploy our approach on Husky UGV mobile platform, which move through the office corridors under proposed MPC local trajectory planner. The code and trained models are available at \url{https://github.com/CognitiveAISystems/Dynamic-Neural-Potential-Field}.

arxiv情報

著者 Aleksey Staroverov,Muhammad Alhaddad,Aditya Narendra,Konstantin Mironov,Aleksandr Panov
発行日 2024-10-09 12:27:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | コメントする

A Safety Modulator Actor-Critic Method in Model-Free Safe Reinforcement Learning and Application in UAV Hovering

要約

この論文では、モデルフリーの安全強化学習 (RL) における安全制約と過大評価の緩和に対処するための安全モジュレーター アクター クリティカル (SMAC) 法を提案します。
安全モジュレーターは、アクションを調整することで安全制約を満たすように開発されており、ポリシーが安全制約を無視して報酬の最大化に集中できるようにします。
さらに、安全制約による Q 値の過大評価を緩和するために、SMAC の理論更新ルールを備えた分布批評家が提案されています。
無人航空機 (UAV) のホバリングに関するシミュレーションと現実世界のシナリオ実験の両方で、SMAC が安全上の制約を効果的に維持し、主流のベースライン アルゴリズムを上回るパフォーマンスを発揮できることが確認されています。

要約(オリジナル)

This paper proposes a safety modulator actor-critic (SMAC) method to address safety constraint and overestimation mitigation in model-free safe reinforcement learning (RL). A safety modulator is developed to satisfy safety constraints by modulating actions, allowing the policy to ignore safety constraint and focus on maximizing reward. Additionally, a distributional critic with a theoretical update rule for SMAC is proposed to mitigate the overestimation of Q-values with safety constraints. Both simulation and real-world scenarios experiments on Unmanned Aerial Vehicles (UAVs) hovering confirm that the SMAC can effectively maintain safety constraints and outperform mainstream baseline algorithms.

arxiv情報

著者 Qihan Qi,Xinsong Yang,Gang Xia,Daniel W. C. Ho,Pengyang Tang
発行日 2024-10-09 13:07:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO | コメントする

Safe Reinforcement Learning Filter for Multicopter Collision-Free Tracking under disturbances

要約

本稿では、入力外乱によるマルチコプタの無衝突軌道追跡を実現するための安全強化学習フィルタ(SRLF)を提案する。
追跡中の未知の外乱との衝突を回避するために、新しいロバスト コントロール バリア関数 (RCBF) とその解析技術が導入されています。
システム状態が安全なセット内に確実に収まるように、RCBF ゲインは制御動作で設計されています。
安全でない強化学習 (RL) 制御入力を安全なものに変換するために安全フィルターが導入され、安全性の制約を明示的に考慮せずに RL トレーニングを続行できるようになります。
SRLF は、RCBF の前方不変性と入力飽和制約を組み込んだ二次計画法 (QP) 問題を解くことにより、厳密に保証された安全な制御動作を取得します。
マルチコプターでのシミュレーションと現実世界の実験の両方で、入力外乱や飽和下で衝突のない追跡を達成する際の SRLF の有効性と優れたパフォーマンスが実証されています。

要約(オリジナル)

This paper proposes a safe reinforcement learning filter (SRLF) to realize multicopter collision-free trajectory tracking with input disturbance. A novel robust control barrier function (RCBF) with its analysis techniques is introduced to avoid collisions with unknown disturbances during tracking. To ensure the system state remains within the safe set, the RCBF gain is designed in control action. A safety filter is introduced to transform unsafe reinforcement learning (RL) control inputs into safe ones, allowing RL training to proceed without explicitly considering safety constraints. The SRLF obtains rigorous guaranteed safe control action by solving a quadratic programming (QP) problem that incorporates forward invariance of RCBF and input saturation constraints. Both simulation and real-world experiments on multicopters demonstrate the effectiveness and excellent performance of SRLF in achieving collision-free tracking under input disturbances and saturation.

arxiv情報

著者 Qihan Qi,Xinsong Yang,Gang Xia
発行日 2024-10-09 13:16:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | コメントする

Combining Planning and Diffusion for Mobility with Unknown Dynamics

要約

長い視野にわたる大きなオブジェクト (倉庫内のカートなど) の操作は、展開可能なロボット システムにとって不可欠なスキルです。
大きな物体には、物体を牽引して同時に操作、ナビゲーション、移動を行うモバイル操作が必要です。
現実世界の多くの状況では、オフィスチェア (回転ベースと 5 つのキャスターホイール付き) と地面の相互作用など、オブジェクトのダイナミクスは非常に複雑です。
ダイナミクスが部分的に不明な長距離ロボット操作問題に対する階層アルゴリズムを提案します。
拡散ベースの動作クローニングは、ダイナミクスが未知の短距離問題に対して非常に効果的であることが観察されたため、この問題を、ウェイポイント シーケンスを生成する抽象的な高レベルの障害物認識運動計画問題に分解します。
ウェイポイントを順番に達成するために、短地平線の相対運動拡散ポリシーを使用します。
私たちは、オフィスの椅子を押したり引いたりする必要がある Spot ロボットでモバイル操作ポリシーをトレーニングします。
私たちの階層的操作ポリシーは、長い水平線のデモンストレーションや、しっかりと取り付けられたオブジェクトを想定した動作計画で訓練された拡散ポリシーと比較して、特に水平線が長くなった場合に一貫して優れたパフォーマンスを発揮します (10 回の実行中、成功率は 8 (それぞれ 0 と 5))。
)。
重要なのは、私たちが学習したポリシーは、さらなるトレーニングなしで、より多くの摩擦を引き起こす新しいレイアウト、グリップ、椅子、床材に一般化され、他の複雑なモバイル操作の問題にも有望であることを示しています。
プロジェクトページ: https://yravan.github.io/plannerownedpolicy/

要約(オリジナル)

Manipulation of large objects over long horizons (such as carts in a warehouse) is an essential skill for deployable robotic systems. Large objects require mobile manipulation which involves simultaneous manipulation, navigation, and movement with the object in tow. In many real-world situations, object dynamics are incredibly complex, such as the interaction of an office chair (with a rotating base and five caster wheels) and the ground. We present a hierarchical algorithm for long-horizon robot manipulation problems in which the dynamics are partially unknown. We observe that diffusion-based behavior cloning is highly effective for short-horizon problems with unknown dynamics, so we decompose the problem into an abstract high-level, obstacle-aware motion-planning problem that produces a waypoint sequence. We use a short-horizon, relative-motion diffusion policy to achieve the waypoints in sequence. We train mobile manipulation policies on a Spot robot that has to push and pull an office chair. Our hierarchical manipulation policy performs consistently better, especially when the horizon increases, compared to a diffusion policy trained on long-horizon demonstrations or motion planning assuming a rigidly-attached object (success rate of 8 (versus 0 and 5 respectively) out of 10 runs). Importantly, our learned policy generalizes to new layouts, grasps, chairs, and flooring that induces more friction, without any further training, showing promise for other complex mobile manipulation problems. Project Page: https://yravan.github.io/plannerorderedpolicy/

arxiv情報

著者 Yajvan Ravan,Zhutian Yang,Tao Chen,Tomás Lozano-Pérez,Leslie Pack Kaelbling
発行日 2024-10-09 14:12:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | コメントする

Gaitor: Learning a Unified Representation Across Gaits for Real-World Quadruped Locomotion

要約

現在の最先端の四足歩行は、さまざまな複雑な動きを生み出すことができます。
これらの方法は、個別のスキル セット間の切り替えに依存するか、複雑なブラック ボックス モデルを使用して歩行全体の分布を学習します。
あるいは、移動歩行全体のもつれのない 2D 表現を学習する Gaitor を紹介します。
この学習された表現は、閉ループ制御のための計画空間を形成し、連続的な歩行遷移と知覚的な地形横断を実現します。
ゲイターの潜在空間は容易に解釈可能であり、歩行の移行中に新たな目に見えない歩行が出現することがわかります。
潜在スペースは、フットスイングの高さと長さに関して解きほぐされます。
これは、これらの歩行特性が 2D 潜在表現で独立して変化できることを意味します。
シンプルな地形エンコードと、潜在空間で動作する学習済みプランナーを組み合わせて、Gaitor は、不均一な地形に反応しながら、望ましい歩行タイプやスイング特性を含む動作コマンドを受け取ることができます。
ANYmal C プラットフォーム上のシミュレーションと現実世界の両方で Gaitor を評価します。
私たちの知る限り、これは複数の歩行について統一され解釈可能な潜在空間を学習した最初の研究であり、その結果、実際の四足ロボットの異なる移動モード間の継続的なブレンドが可能になります。
この論文の手法と結果の概要は、https://youtu.be/eVFQbRyilCA にあります。

要約(オリジナル)

The current state-of-the-art in quadruped locomotion is able to produce a variety of complex motions. These methods either rely on switching between a discrete set of skills or learn a distribution across gaits using complex black-box models. Alternatively, we present Gaitor, which learns a disentangled and 2D representation across locomotion gaits. This learnt representation forms a planning space for closed-loop control delivering continuous gait transitions and perceptive terrain traversal. Gaitor’s latent space is readily interpretable and we discover that during gait transitions, novel unseen gaits emerge. The latent space is disentangled with respect to footswing heights and lengths. This means that these gait characteristics can be varied independently in the 2D latent representation. Together with a simple terrain encoding and a learnt planner operating in the latent space, Gaitor can take motion commands including desired gait type and swing characteristics all while reacting to uneven terrain. We evaluate Gaitor in both simulation and the real world on the ANYmal C platform. To the best of our knowledge, this is the first work learning a unified and interpretable latent space for multiple gaits, resulting in continuous blending between different locomotion modes on a real quadruped robot. An overview of the methods and results in this paper is found at https://youtu.be/eVFQbRyilCA.

arxiv情報

著者 Alexander L. Mitchell,Wolfgang Merkt,Aristotelis Papatheodorou,Ioannis Havoutis,Ingmar Posner
発行日 2024-10-09 14:27:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO | コメントする