Large-Scale Gaussian Splatting SLAM

要約

最近開発されたニューラル放射輝度(NERF)および3Dガウススプラッティング(3DG)は、視覚的なスラムの励ましと印象的な結果を示しています。
ただし、ほとんどの代表的な方法ではRGBDセンサーが必要であり、屋内環境でのみ利用できます。
大規模な屋外シナリオでの再建の堅牢性は未開拓のままです。
このペーパーでは、LSG-SLAMと呼ばれるステレオカメラを備えた大規模な3DGSベースのビジュアルスラムを紹介します。
提案されているLSG-SLAMは、マルチモダリティ戦略を採用して、大規模なビューの変更に基づいて以前のポーズを推定しています。
追跡では、レンダリング損失における外観の類似性の悪影響を緩和するために、特徴調整のゆがみの制約を導入します。
大規模なシナリオのスケーラビリティについては、連続したガウスのスプラッティングサブマップを導入して、メモリが限られている無制限のシーンに取り組みます。
ループは、場所認識によってGSサブマップ間で検出され、ループされたキーフレーム間の相対的なポーズは、レンダリングと特徴のワーピング損失を利用して最適化されています。
カメラのグローバルな最適化とガウスポイントのポーズの後、構造改良モジュールは再構成品質を向上させます。
EurocおよびKittiデータセットに関する広範な評価により、LSG-SLAMは既存のニューラル、3DGSベース、さらには従来のアプローチよりも優れたパフォーマンスを達成します。
プロジェクトページ:https://lsg-slam.github.io。

要約(オリジナル)

The recently developed Neural Radiance Fields (NeRF) and 3D Gaussian Splatting (3DGS) have shown encouraging and impressive results for visual SLAM. However, most representative methods require RGBD sensors and are only available for indoor environments. The robustness of reconstruction in large-scale outdoor scenarios remains unexplored. This paper introduces a large-scale 3DGS-based visual SLAM with stereo cameras, termed LSG-SLAM. The proposed LSG-SLAM employs a multi-modality strategy to estimate prior poses under large view changes. In tracking, we introduce feature-alignment warping constraints to alleviate the adverse effects of appearance similarity in rendering losses. For the scalability of large-scale scenarios, we introduce continuous Gaussian Splatting submaps to tackle unbounded scenes with limited memory. Loops are detected between GS submaps by place recognition and the relative pose between looped keyframes is optimized utilizing rendering and feature warping losses. After the global optimization of camera poses and Gaussian points, a structure refinement module enhances the reconstruction quality. With extensive evaluations on the EuRoc and KITTI datasets, LSG-SLAM achieves superior performance over existing Neural, 3DGS-based, and even traditional approaches. Project page: https://lsg-slam.github.io.

arxiv情報

著者 Zhe Xin,Chenyang Wu,Penghui Huang,Yanyong Zhang,Yinian Mao,Guoquan Huang
発行日 2025-05-15 03:00:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | コメントする

Hyper Yoshimura: How a slight tweak on a classical folding pattern unleashes meta-stability for deployable robots

要約

折り紙に触発された展開可能な構造は、ロボットおよび建築用途向けの軽量、コンパクト、および再構成可能なソリューションを提供します。
新たに特定された非対称の「ポップアウト」および「ハイパーフォールド」構成を含む、多様なメタスト可能な状態をサポートするヨシムラオリモジュールの幾何学的および機械的フレームワークを提示します。
これらの状態は、傾斜角、位相シフト、傾斜の高さの3つのパラメーターによって支配され、個別のプログラム可能な変換を可能にします。
このモデルを使用して、モジュールを積み重ねて複雑な3Dシェイプを概算する展開可能なブームに積み重ねるために、前方および逆運動戦略を開発します。
機械的テストを通じてアプローチを検証し、オブジェクトの操作、ソーラー追跡、および荷重を負担する高いパフォーマンスが可能な腱および空気圧式が作動するヨシムラスペースクレーンを実証します。
メータースケールのソーラー充電ステーションは、デザインのスケーラビリティをさらに示しています。
これらの結果は、地上環境と空間環境の両方で適応可能で多機能展開可能なシステムのための有望なプラットフォームとしてヨシムラ-ORI構造を確立しています。

要約(オリジナル)

Deployable structures inspired by origami offer lightweight, compact, and reconfigurable solutions for robotic and architectural applications. We present a geometric and mechanical framework for Yoshimura-Ori modules that supports a diverse set of metastable states, including newly identified asymmetric ‘pop-out’ and ‘hyperfolded’ configurations. These states are governed by three parameters — tilt angle, phase shift, and slant height — and enable discrete, programmable transformations. Using this model, we develop forward and inverse kinematic strategies to stack modules into deployable booms that approximate complex 3D shapes. We validate our approach through mechanical tests and demonstrate a tendon- and pneumatically-actuated Yoshimura Space Crane capable of object manipulation, solar tracking, and high load-bearing performance. A meter-scale solar charging station further illustrates the design’s scalability. These results establish Yoshimura-Ori structures as a promising platform for adaptable, multifunctional deployable systems in both terrestrial and space environments.

arxiv情報

著者 Ziyang Zhou,Yogesh Phalak,Vishrut Deshpande,Ian Walker,Suyi Li
発行日 2025-05-15 03:07:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | コメントする

Learning Diverse Natural Behaviors for Enhancing the Agility of Quadrupedal Robots

要約

動物のような敏ility性を達成することは、四角形ロボット工学の長年の目標です。
最近の研究は特定の行動の模倣を成功裏に実証していますが、ロボットが現実世界の環境でより広範な自然行動を複製できるようにすることは、依然としてオープンな課題です。
ここでは、基本的な動作コントローラー(BBC)とタスク固有のコントローラー(TSC)を含む統合コントローラーを提案します。タスク固有のコントローラーは、強化されたシミュレーターで多様な自然な四角形の動作を効果的に学習し、それらを現実世界に効率的に転送できます。
具体的には、BBCは、本物の犬の生のモーションキャプチャデータから多様な動作スタイルを抽出するために、新しい半監視生成官能的模倣学習アルゴリズムを使用して訓練され、個別の潜在的な可変入力を調整することによりスムーズな動作遷移を可能にします。
TSCは、入力として深さ画像を使用して特権学習を介して訓練され、BBCを調整して、さまざまなタスクを効率的に実行します。
さらに、進化的な敵対的なシミュレーターの識別を採用して、シミュレーターを最適化し、現実と密接に合わせています。
トレーニング後、ロボットは多様な自然行動を示し、平均速度1.1 m/sで四葉症の敏ility性チャレンジを正常に完了し、ハードル中に3.2 m/sのピーク速度を達成します。
この作業は、四角形ロボットにおける動物のような敏ility性への実質的なステップを表しており、ますます複雑になっている現実世界の環境での展開の手段を開きます。

要約(オリジナル)

Achieving animal-like agility is a longstanding goal in quadrupedal robotics. While recent studies have successfully demonstrated imitation of specific behaviors, enabling robots to replicate a broader range of natural behaviors in real-world environments remains an open challenge. Here we propose an integrated controller comprising a Basic Behavior Controller (BBC) and a Task-Specific Controller (TSC) which can effectively learn diverse natural quadrupedal behaviors in an enhanced simulator and efficiently transfer them to the real world. Specifically, the BBC is trained using a novel semi-supervised generative adversarial imitation learning algorithm to extract diverse behavioral styles from raw motion capture data of real dogs, enabling smooth behavior transitions by adjusting discrete and continuous latent variable inputs. The TSC, trained via privileged learning with depth images as input, coordinates the BBC to efficiently perform various tasks. Additionally, we employ evolutionary adversarial simulator identification to optimize the simulator, aligning it closely with reality. After training, the robot exhibits diverse natural behaviors, successfully completing the quadrupedal agility challenge at an average speed of 1.1 m/s and achieving a peak speed of 3.2 m/s during hurdling. This work represents a substantial step toward animal-like agility in quadrupedal robots, opening avenues for their deployment in increasingly complex real-world environments.

arxiv情報

著者 Huiqiao Fu,Haoyu Dong,Wentao Xu,Zhehao Zhou,Guizhou Deng,Kaiqiang Tang,Daoyi Dong,Chunlin Chen
発行日 2025-05-15 05:32:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | コメントする

Provably safe and human-like car-following behaviors: Part 1. Analysis of phases and dynamics in standard models

要約

軌道計画は、コミュニケーション、センシング、および天候、道路状況、政策、その他の道路利用者などの動的な要因に関連する不確実性に直面して安全な運転を確保するために不可欠です。
既存の自動車フォローモデルは、しばしば厳密な安全証明と、人間のような運転行動を一貫して複製する能力を欠いています。
この記事では、多相動的システム分析をよく知られている自動車フォローモデルに適用して、既存のアプローチの特性と制限を強調しています。
私たちは、快適さと最小ジャム間隔のためのゼロオーダーの原則、速度と時間のギャップのための1次原理、および快適加速/減速境界の2次原理、およびブレーキングプロフィールを含む、安全で人間のような自動車中の行動の基本原則を策定することから始めます。
これらのゼロトと1次原理のセットから、Newellの単純化された車によるモデルを導き出します。
その後、Newellのモデルの固定鉛車両問題と、境界加速度と減速の両方を組み込んだ拡張の速度間隔内のフェーズを分析します。
次に、インテリジェントドライバーモデルとGIPPSモデルのパフォーマンスを分析します。
この分析を通じて、前述の原則のいくつかに関して、これらのモデルの制限を強調します。
数値シミュレーションと経験的観測は、理論的洞察を検証します。
最後に、この研究のパート2で対処されている自動車中のモデルの安全性、人間のような行動、および車両自動化をさらに統合するための将来の研究の方向性について説明します。

要約(オリジナル)

Trajectory planning is essential for ensuring safe driving in the face of uncertainties related to communication, sensing, and dynamic factors such as weather, road conditions, policies, and other road users. Existing car-following models often lack rigorous safety proofs and the ability to replicate human-like driving behaviors consistently. This article applies multi-phase dynamical systems analysis to well-known car-following models to highlight the characteristics and limitations of existing approaches. We begin by formulating fundamental principles for safe and human-like car-following behaviors, which include zeroth-order principles for comfort and minimum jam spacings, first-order principles for speeds and time gaps, and second-order principles for comfort acceleration/deceleration bounds as well as braking profiles. From a set of these zeroth- and first-order principles, we derive Newell’s simplified car-following model. Subsequently, we analyze phases within the speed-spacing plane for the stationary lead-vehicle problem in Newell’s model and its extensions, which incorporate both bounded acceleration and deceleration. We then analyze the performance of the Intelligent Driver Model and the Gipps model. Through this analysis, we highlight the limitations of these models with respect to some of the aforementioned principles. Numerical simulations and empirical observations validate the theoretical insights. Finally, we discuss future research directions to further integrate safety, human-like behaviors, and vehicular automation in car-following models, which are addressed in Part 2 of this study \citep{jin2025WA20-02_Part2}, where we develop a novel multi-phase projection-based car-following model that addresses the limitations identified here.

arxiv情報

著者 Wen-Long Jin
発行日 2025-05-15 05:56:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY, physics.soc-ph | コメントする

Provably safe and human-like car-following behaviors: Part 2. A parsimonious multi-phase model with projected braking

要約

現実世界の不確実性の中で自動化された車両の安全で人間のような軌道計画を確保することは、依然として重要な課題です。
既存の自動車フォローモデルは、人間のような加速と減速パターンとともに、一貫して厳密な安全証明を提供するのに苦労していますが、新しい多相投影ベースの自動車フォローモデルを導入します。
このモデルは、主要な人間の運転原則をエミュレートしながら、限界加速度と減速速度を組み込むことにより、安全性とパフォーマンスのバランスをとるように設計されています。
基本的な駆動原則と多相動的システム分析の基礎に基づいて(この研究のパート1で詳述されています\ citep {jin2025wa20-02_part1})、最初に、newellのような標準モデルの拡張の制限を単純な境界減速で強調します。
人間のドライバーの予測行動に触発されて、私たちはリーダー車とフォロワー車両の両方の予測されるブレーキプロファイルを数学的に定義および分析し、予測されるブレーキ鉛車両の問題に基づいて安全基準と新しい位相定義を確立します。
提案されているpar約的なモデルは、拡張されたNewellの名目運転のモデルを組み合わせて、予測されるブレーキを必要とするシナリオの新しい制御法と新しい制御法則を組み合わせています。
速度間隔の位相平面分析を使用して、合理的な初期条件下で、衝突のない操作、境界の減速、許容可能な安全停止距離など、定義された安全で人間のような運転原則に対するモデルの遵守の厳密な数学的証拠を提供します。
数値シミュレーションは、静止した鉛車両問題の安全性と人間のようなブレーキプロファイルの両方を達成する上で、モデルの優れたパフォーマンスを検証します。
最後に、モデルの意味と将来の研究の方向性について説明します。

要約(オリジナル)

Ensuring safe and human-like trajectory planning for automated vehicles amidst real-world uncertainties remains a critical challenge. While existing car-following models often struggle to consistently provide rigorous safety proofs alongside human-like acceleration and deceleration patterns, we introduce a novel multi-phase projection-based car-following model. This model is designed to balance safety and performance by incorporating bounded acceleration and deceleration rates while emulating key human driving principles. Building upon a foundation of fundamental driving principles and a multi-phase dynamical systems analysis (detailed in Part 1 of this study \citep{jin2025WA20-02_Part1}), we first highlight the limitations of extending standard models like Newell’s with simple bounded deceleration. Inspired by human drivers’ anticipatory behavior, we mathematically define and analyze projected braking profiles for both leader and follower vehicles, establishing safety criteria and new phase definitions based on the projected braking lead-vehicle problem. The proposed parsimonious model combines an extended Newell’s model for nominal driving with a new control law for scenarios requiring projected braking. Using speed-spacing phase plane analysis, we provide rigorous mathematical proofs of the model’s adherence to defined safe and human-like driving principles, including collision-free operation, bounded deceleration, and acceptable safe stopping distance, under reasonable initial conditions. Numerical simulations validate the model’s superior performance in achieving both safety and human-like braking profiles for the stationary lead-vehicle problem. Finally, we discuss the model’s implications and future research directions.

arxiv情報

著者 Wen-Long Jin
発行日 2025-05-15 06:03:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY, physics.soc-ph | コメントする

Multi-layer Motion Planning with Kinodynamic and Spatio-Temporal Constraints

要約

キノダイナミックと空間的制約の両方を満たすパスを計算するための新しい多層計画アプローチを提案します。
3部構成のフレームワークは、最初に空間制約を満たすための潜在的なシーケンスを確立し、それらを使用して幾何学的なリードパスを計算します。
このパスは、漸近的に最適なサンプリングベースの運動力学プランナーを導きます。これにより、STL堅牢性のコストが最小限に抑えられ、時空間および運動力学的制約が共同で満たされます。
実験では、速度制御されたアッカーマンカーモデルで方法をテストし、以前のARTと比較して有意な効率の向上を示します。
さらに、私たちの方法は、以前の方法が実証していなかったクロスオーバーなど、複雑なパス操作を生成することができます。

要約(オリジナル)

We propose a novel, multi-layered planning approach for computing paths that satisfy both kinodynamic and spatiotemporal constraints. Our three-part framework first establishes potential sequences to meet spatial constraints, using them to calculate a geometric lead path. This path then guides an asymptotically optimal sampling-based kinodynamic planner, which minimizes an STL-robustness cost to jointly satisfy spatiotemporal and kinodynamic constraints. In our experiments, we test our method with a velocity-controlled Ackerman-car model and demonstrate significant efficiency gains compared to prior art. Additionally, our method is able to generate complex path maneuvers, such as crossovers, something that previous methods had not demonstrated.

arxiv情報

著者 Jeel Chatrola,Abhiroop Ajith,Kevin Leahy,Constantinos Chamzas
発行日 2025-05-15 06:09:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | コメントする

LEMON-Mapping: Loop-Enhanced Large-Scale Multi-Session Point Cloud Merging and Optimization for Globally Consistent Mapping

要約

ロボット工学の急速な発展に伴い、マルチロボットのコラボレーションは重要で挑戦的になりました。
重要な問題の1つは、複数のロボットからのデータを統合して、堅牢な協力と正確なローカリゼーションのためのグローバルに一貫した正確なマップを構築することです。
従来のマルチロボットポーズグラフ最適化(PGO)は基本的なグローバルな一貫性を維持していますが、主にポーズ最適化に焦点を当て、マップの幾何学的構造を無視します。
さらに、PGOは2つのノード間の制約としてループクロージャーのみを使用し、マルチロボットマップの局所的な一貫性を維持する能力を完全に活用できません。
したがって、PGOベースのマルチロボットマッピング方法は、特にサブマップが重複する地域では、深刻な地図の発散とぼやけに苦しむことがよくあります。
この問題に対処するために、レモンマッピング、大規模なマルチセッションポイントクラウドマップの融合と最適化のループ強化フレームワークを提案します。これは、ループクロージャーを合理的に利用し、マップの幾何学的品質を向上させます。
マルチロボットマッピングのループの役割を再検討し、3つの重要なイノベーションを導入します。
まず、外れ値を効果的に拒否する堅牢なループ処理メカニズムと、誤って削除されたループを回復するための新しいループリコール戦略を開発します。
第二に、重複する領域の発散を大幅に減らし、マップぼかしを排除するマルチロボットマップの空間バンドル調整方法を導入します。
第三に、バンドル調整の洗練された制約を活用して、ローカルの精度をグローバルマップに拡張するPGO戦略を設計します。
いくつかのパブリックデータセットと自己収集データセットでフレームワークを検証します。
実験結果は、私たちの方法が、マッピングの精度とマップの発散の削減のマッピングの観点から、従来のマップのマージアプローチよりも優れていることを示しています。
スケーラビリティ実験は、多数のロボットを含むシナリオを処理するフレームワークの強力な能力も示しています。

要約(オリジナル)

With the rapid development of robotics, multi-robot collaboration has become critical and challenging. One key problem is integrating data from multiple robots to build a globally consistent and accurate map for robust cooperation and precise localization. While traditional multi-robot pose graph optimization (PGO) maintains basic global consistency, it focuses primarily on pose optimization and ignores the geometric structure of the map. Moreover, PGO only uses loop closure as a constraint between two nodes, failing to fully exploit its capability to maintaining local consistency of multi-robot maps. Therefore, PGO-based multi-robot mapping methods often suffer from serious map divergence and blur, especially in regions with overlapping submaps. To address this issue, we propose Lemon-Mapping, a loop-enhanced framework for large-scale multi-session point cloud map fusion and optimization, which reasonably utilizes loop closure and improves the geometric quality of the map. We re-examine the role of loops for multi-robot mapping and introduce three key innovations. First, we develop a robust loop processing mechanism that effectively rejects outliers and a novel loop recall strategy to recover mistakenly removed loops. Second, we introduce a spatial bundle adjustment method for multi-robot maps that significantly reduces the divergence in overlapping regions and eliminates map blur. Third, we design a PGO strategy that leverages the refined constraints of bundle adjustment to extend the local accuracy to the global map. We validate our framework on several public datasets and a self-collected dataset. Experimental results demonstrate that our method outperforms traditional map merging approaches in terms of mapping accuracy and reduction of map divergence. Scalability experiments also demonstrate the strong capability of our framework to handle scenarios involving numerous robots.

arxiv情報

著者 Lijie Wang,Xiaoyi Zhong,Ziyi Xu,Kaixin Chai,Anke Zhao,Tianyu Zhao,Qianhao Wang,Fei Gao
発行日 2025-05-15 06:59:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | コメントする

Threshold Strategy for Leaking Corner-Free Hamilton-Jacobi Reachability with Decomposed Computations

要約

Hamilton-Jacobi(HJ)Reachabilityは、特定の制御目標を満たす状態の価値関数を計算するために広く使用されています。
ただし、次元の呪いにより、高次元の問題には扱いにくいものになります。
この課題を緩和するためには、次元削減アプローチが不可欠ですが、「コーナーの漏れの問題」を導入することができ、結果の不正確さにつながる可能性があります。
この論文では、価値関数の観点から「コーナーの漏れの問題」を定義し、その発生に必要な条件を提案し、証明します。
次に、これらの理論的貢献を使用して、次元削減アプローチの計算効率を維持しながら、不正確な値関数を効率的に修正する新しいローカル更新方法を導入します。
数値シミュレーションを通じて、方法の有効性を実証します。
自己完結型のサブシステム分解(SCSD)を使用して方法を検証しますが、私たちのアプローチは「角を漏らす」他の次元削減技術に適用できます。

要約(オリジナル)

Hamilton-Jacobi (HJ) Reachability is widely used to compute value functions for states satisfying specific control objectives. However, it becomes intractable for high-dimensional problems due to the curse of dimensionality. Dimensionality reduction approaches are essential for mitigating this challenge, whereas they could introduce the “leaking corner issue’, leading to inaccuracies in the results. In this paper, we define the “leaking corner issue’ in terms of value functions, propose and prove a necessary condition for its occurrence. We then use these theoretical contributions to introduce a new local updating method that efficiently corrects inaccurate value functions while maintaining the computational efficiency of the dimensionality reduction approaches. We demonstrate the effectiveness of our method through numerical simulations. Although we validate our method with the self-contained subsystem decomposition (SCSD), our approach is applicable to other dimensionality reduction techniques that introduce the “leaking corners’.

arxiv情報

著者 Chong He,Mugilan Mariappan,Keval Vora,Mo Chen
発行日 2025-05-15 07:06:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | コメントする

APEX: Action Priors Enable Efficient Exploration for Skill Imitation on Articulated Robots

要約

模倣による学習は、ロボットが十分に規制された複雑な行動を開発し、自然なデモンストレーションから直接恩恵を受ける効果的な方法を提供します。
通常、最先端の模倣学習(IL)アプローチは、通常、敵対的な運動前(AMP)を活用します。これは、印象的な結果にもかかわらず、2つの重要な制限に苦しんでいます。
彼らはモードの崩壊を起こしやすく、それはしばしばシミュレーション環境への過剰適合につながり、したがってSIMからリアルのギャップを増加させ、彼らは多様な行動を効果的に学ぶのに苦労しています。
これらの制限を克服するために、APEX(アクションプライアーが効率的な探索を有効にする)を導入します。デモンストレーションを強化学習(RL)に直接統合するシンプルでありながら多目的な模倣学習フレームワーク(RL)を統合し、専門家に基づいたプライアーとの接地行動を維持します。
これは、最初は専門家のデモンストレーションに向けて探査をバイアスするが、ポリシーが独立して探求できるようにすることを最初に偏っている崩壊するアクションプライアーの組み合わせを通じて達成します。
これは、スタイルの一貫性とタスクパフォ​​ーマンスのバランスを効果的にバランスさせるマルチクリティックRLフレームワークによって補完されます。
私たちのアプローチは、サンプル効率の高い模倣学習を実現し、単一のポリシー内で多様なスキルを獲得することを可能にします。
Apexは、さまざまな速度に一般化し、粗い地形のナビゲートや階段の登山などの複雑なタスク全体で参照のようなスタイルを保存し、以前のフラットテレイン運動モーションデータのみを利用します。
Unitree GO2四足動物での広範なハードウェア実験を通じて、フレームワークを検証します。
そこでは、Apexは、多様で機敏な移動歩行、固有の歩行遷移、およびプラットフォームで最も高い報告速度を私たちの知識を得て生成します(ハードウェアの〜3.3 m/sのピーク速度)。
我々の結果は、Apexを既存のILメソッドに代わる説得力のある代替手段として確立し、より良い効率、適応性、および現実世界のパフォーマンスを提供します。

要約(オリジナル)

Learning by imitation provides an effective way for robots to develop well-regulated complex behaviors and directly benefit from natural demonstrations. State-of-the-art imitation learning (IL) approaches typically leverage Adversarial Motion Priors (AMP), which, despite their impressive results, suffer from two key limitations. They are prone to mode collapse, which often leads to overfitting to the simulation environment and thus increased sim-to-real gap, and they struggle to learn diverse behaviors effectively. To overcome these limitations, we introduce APEX (Action Priors enable Efficient eXploration): a simple yet versatile imitation learning framework that integrates demonstrations directly into reinforcement learning (RL), maintaining high exploration while grounding behavior with expert-informed priors. We achieve this through a combination of decaying action priors, which initially bias exploration toward expert demonstrations but gradually allow the policy to explore independently. This is complemented by a multi-critic RL framework that effectively balances stylistic consistency with task performance. Our approach achieves sample-efficient imitation learning and enables the acquisition of diverse skills within a single policy. APEX generalizes to varying velocities and preserves reference-like styles across complex tasks such as navigating rough terrain and climbing stairs, utilizing only flat-terrain kinematic motion data as a prior. We validate our framework through extensive hardware experiments on the Unitree Go2 quadruped. There, APEX yields diverse and agile locomotion gaits, inherent gait transitions, and the highest reported speed for the platform to the best of our knowledge (peak velocity of ~3.3 m/s on hardware). Our results establish APEX as a compelling alternative to existing IL methods, offering better efficiency, adaptability, and real-world performance.

arxiv情報

著者 Shivam Sood,Laukik B Nakhwa,Yuhong Cao,Sun Ge,Guillaume Sartoretti
発行日 2025-05-15 07:09:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | コメントする

Fast Heuristic Scheduling and Trajectory Planning for Robotic Fruit Harvesters with Multiple Cartesian Arms

要約

この作業は、複数のデカルトロボットアームを収穫する果物の結合されたスケジューリングと軌跡計画のための高速ヒューリスティックアルゴリズムを提案しています。
私たちの方法は、ワークスペースを分割し、フルーツピッキングシーケンスをアームに割り当て、緊密で実現可能なフルーツピッキングスケジュールと車両の移動速度を決定し、滑らかで衝突のない腕の軌跡を生成します。
アルゴリズムによって達成されたフルーツピッキングスループットは、合成的に生成されたフルーツ座標と最大12個のアームを備えたハーベスターデザインを使用して評価されました。
スループットは、より多くの腕が追加されるにつれて単調に増加しました。
果物の密度が低いときに腕を追加すると、ある果物から別の果物に移動するのに時間がかかったため、利益が減少しました。
ただし、十分な果物があった場合、提案されたアルゴリズムは、アームの数が増えるにつれて線形スピードアップを達成しました。

要約(オリジナル)

This work proposes a fast heuristic algorithm for the coupled scheduling and trajectory planning of multiple Cartesian robotic arms harvesting fruits. Our method partitions the workspace, assigns fruit-picking sequences to arms, determines tight and feasible fruit-picking schedules and vehicle travel speed, and generates smooth, collision-free arm trajectories. The fruit-picking throughput achieved by the algorithm was assessed using synthetically generated fruit coordinates and a harvester design featuring up to 12 arms. The throughput increased monotonically as more arms were added. Adding more arms when fruit densities were low resulted in diminishing gains because it took longer to travel from one fruit to another. However, when there were enough fruits, the proposed algorithm achieved a linear speedup as the number of arms increased.

arxiv情報

著者 Yuankai Zhu,Stavros Vougioukas
発行日 2025-05-15 07:20:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | コメントする