Diffusion-SAFE: Shared Autonomy Framework with Diffusion for Safe Human-to-Robot Driving Handover

要約

車両制御のための共有自治の安全な引き渡しは、現代の車両では確立されています。
ただし、事故を回避するには、多くの場合、数秒前にアクションが必要です。
これにより、衝突状態または安全でない状態が予測される場合、人間のドライバーの行動と、シームレスな介入のための専門家の制御戦略を理解する必要があります。
(1)潜在的なリスクの検出のための人間の運転行動を予測するために、拡散モデルを活用する閉ループ共有自律フレームワークである拡散セーフを提案します。
エンジニアリングスコア関数を使用して運転性能を評価する以前の作品とは異なり、私たちのアプローチにより、パフォーマンス評価とデモンストレーションからの最適なアクションシーケンス生成の両方が可能になります。
拡散ベースの副操縦士の前後のプロセスを調整することにより、我々の方法は、介入前にドライバーの行動を模倣することにより、制御権限の徐々に移行し、突然の買収を軽減し、スムーズな移行につながることにより、制御権限の徐々に移行します。
シミュレーション(Carracing-V0)と実世界(ROSベースのレースカー)の両方で拡散セーフを評価し、ヒト運転の類似性、安全性、計算効率を測定しました。
結果は、98.5%のハンドオーバー率が成功したことを示しており、人間のアクションを徐々に修正し、最適なロボットアクションを継続的にサンプリングする際のフレームワークの有効性を強調しています。

要約(オリジナル)

Safe handover in shared autonomy for vehicle control is well-established in modern vehicles. However, avoiding accidents often requires action several seconds in advance. This necessitates understanding human driver behavior and an expert control strategy for seamless intervention when a collision or unsafe state is predicted. We propose Diffusion-SAFE, a closed-loop shared autonomy framework leveraging diffusion models to: (1) predict human driving behavior for detection of potential risks, (2) generate safe expert trajectories, and (3) enable smooth handovers by blending human and expert policies over a short time horizon. Unlike prior works which use engineered score functions to rate driving performance, our approach enables both performance evaluation and optimal action sequence generation from demonstrations. By adjusting the forward and reverse processes of the diffusion-based copilot, our method ensures a gradual transition of control authority, by mimicking the drivers’ behavior before intervention, which mitigates abrupt takeovers, leading to smooth transitions. We evaluated Diffusion-SAFE in both simulation (CarRacing-v0) and real-world (ROS-based race car), measuring human-driving similarity, safety, and computational efficiency. Results demonstrate a 98.5\% successful handover rate, highlighting the framework’s effectiveness in progressively correcting human actions and continuously sampling optimal robot actions.

arxiv情報

著者 Yunxin Fan,Monroe Kennedy III
発行日 2025-05-15 01:12:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, H.5.2 | Diffusion-SAFE: Shared Autonomy Framework with Diffusion for Safe Human-to-Robot Driving Handover はコメントを受け付けていません

EMMOE: A Comprehensive Benchmark for Embodied Mobile Manipulation in Open Environments

要約

自然言語によって制御された自律的なホームロボットの開発は、長い間人類の追求でした。
大規模な言語モデル(LLMS)と具体化されたインテリジェンスの進歩により、この目標が近づいていますが、いくつかの課題は持続します。より複雑なロボットタスクの統一ベンチマークの欠如、限られた評価方法とメトリック、LLMSとモバイル操作の軌跡間のデータの互換性。
これらの問題に対処するために、オープン環境で具体化されたモバイル操作(EMMOE)を提案します。これは、エージェントがユーザーの指示を解釈し、連続空間で毎日のタスクを実行する必要があるベンチマークです。
Emmoeは、より多様な評価のための3つの新しいメトリックとともに、高レベルと低レベルの具体化されたタスクを統合フレームワークにシームレスに統合します。
さらに、さまざまなタスク属性、詳細なプロセスアノテーション、障害後の再プラン、およびLLMトレーニングの2つのサブデータセットを特徴とする〜\データセットを収集します。
さらに、私たちは〜\モデルを設計し、洗練されたエージェントシステムは、直接優先最適化(DPO)、軽い加重ナビゲーションおよび操作モデル、および複数のエラー検出メカニズムを備えたLLMで構成されています。
最後に、〜\モデルのパフォーマンスとさまざまなモデルとポリシーの評価を示します。

要約(オリジナル)

Developing autonomous home robots controlled by natural language has long been a pursuit of humanity. While advancements in large language models (LLMs) and embodied intelligence make this goal closer, several challenges persist: the lack of a unified benchmark for more complex robot tasks, limited evaluation methods and metrics, data incompatibility between LLMs and mobile manipulation trajectories. To address these issues, we propose Embodied Mobile Manipulation in Open Environments (EMMOE), a benchmark that requires agents to interpret user instructions and execute long-horizon everyday tasks in continuous space. EMMOE seamlessly integrates high-level and low-level embodied tasks into a unified framework, along with three new metrics for more diverse assessment. Additionally, we collect~\dataset, which features in various task attributes, detailed process annotations, re-plans after failures, and two sub-datasets for LLM training. Furthermore, we design~\model, a sophisticated agent system consists of LLM with Direct Preference Optimization (DPO), light weighted navigation and manipulation models, and multiple error detection mechanisms. Finally, we demonstrate~\model’s performance and evaluations of different models and policies.

arxiv情報

著者 Dongping Li,Tielong Cai,Tianci Tang,Wenhao Chai,Katherine Rose Driggs-Campbell,Gaoang Wang
発行日 2025-05-15 01:34:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO | EMMOE: A Comprehensive Benchmark for Embodied Mobile Manipulation in Open Environments はコメントを受け付けていません

Large-Scale Gaussian Splatting SLAM

要約

最近開発されたニューラル放射輝度(NERF)および3Dガウススプラッティング(3DG)は、視覚的なスラムの励ましと印象的な結果を示しています。
ただし、ほとんどの代表的な方法ではRGBDセンサーが必要であり、屋内環境でのみ利用できます。
大規模な屋外シナリオでの再建の堅牢性は未開拓のままです。
このペーパーでは、LSG-SLAMと呼ばれるステレオカメラを備えた大規模な3DGSベースのビジュアルスラムを紹介します。
提案されているLSG-SLAMは、マルチモダリティ戦略を採用して、大規模なビューの変更に基づいて以前のポーズを推定しています。
追跡では、レンダリング損失における外観の類似性の悪影響を緩和するために、特徴調整のゆがみの制約を導入します。
大規模なシナリオのスケーラビリティについては、連続したガウスのスプラッティングサブマップを導入して、メモリが限られている無制限のシーンに取り組みます。
ループは、場所認識によってGSサブマップ間で検出され、ループされたキーフレーム間の相対的なポーズは、レンダリングと特徴のワーピング損失を利用して最適化されています。
カメラのグローバルな最適化とガウスポイントのポーズの後、構造改良モジュールは再構成品質を向上させます。
EurocおよびKittiデータセットに関する広範な評価により、LSG-SLAMは既存のニューラル、3DGSベース、さらには従来のアプローチよりも優れたパフォーマンスを達成します。
プロジェクトページ:https://lsg-slam.github.io。

要約(オリジナル)

The recently developed Neural Radiance Fields (NeRF) and 3D Gaussian Splatting (3DGS) have shown encouraging and impressive results for visual SLAM. However, most representative methods require RGBD sensors and are only available for indoor environments. The robustness of reconstruction in large-scale outdoor scenarios remains unexplored. This paper introduces a large-scale 3DGS-based visual SLAM with stereo cameras, termed LSG-SLAM. The proposed LSG-SLAM employs a multi-modality strategy to estimate prior poses under large view changes. In tracking, we introduce feature-alignment warping constraints to alleviate the adverse effects of appearance similarity in rendering losses. For the scalability of large-scale scenarios, we introduce continuous Gaussian Splatting submaps to tackle unbounded scenes with limited memory. Loops are detected between GS submaps by place recognition and the relative pose between looped keyframes is optimized utilizing rendering and feature warping losses. After the global optimization of camera poses and Gaussian points, a structure refinement module enhances the reconstruction quality. With extensive evaluations on the EuRoc and KITTI datasets, LSG-SLAM achieves superior performance over existing Neural, 3DGS-based, and even traditional approaches. Project page: https://lsg-slam.github.io.

arxiv情報

著者 Zhe Xin,Chenyang Wu,Penghui Huang,Yanyong Zhang,Yinian Mao,Guoquan Huang
発行日 2025-05-15 03:00:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO | Large-Scale Gaussian Splatting SLAM はコメントを受け付けていません

Hyper Yoshimura: How a slight tweak on a classical folding pattern unleashes meta-stability for deployable robots

要約

折り紙に触発された展開可能な構造は、ロボットおよび建築用途向けの軽量、コンパクト、および再構成可能なソリューションを提供します。
新たに特定された非対称の「ポップアウト」および「ハイパーフォールド」構成を含む、多様なメタスト可能な状態をサポートするヨシムラオリモジュールの幾何学的および機械的フレームワークを提示します。
これらの状態は、傾斜角、位相シフト、傾斜の高さの3つのパラメーターによって支配され、個別のプログラム可能な変換を可能にします。
このモデルを使用して、モジュールを積み重ねて複雑な3Dシェイプを概算する展開可能なブームに積み重ねるために、前方および逆運動戦略を開発します。
機械的テストを通じてアプローチを検証し、オブジェクトの操作、ソーラー追跡、および荷重を負担する高いパフォーマンスが可能な腱および空気圧式が作動するヨシムラスペースクレーンを実証します。
メータースケールのソーラー充電ステーションは、デザインのスケーラビリティをさらに示しています。
これらの結果は、地上環境と空間環境の両方で適応可能で多機能展開可能なシステムのための有望なプラットフォームとしてヨシムラ-ORI構造を確立しています。

要約(オリジナル)

Deployable structures inspired by origami offer lightweight, compact, and reconfigurable solutions for robotic and architectural applications. We present a geometric and mechanical framework for Yoshimura-Ori modules that supports a diverse set of metastable states, including newly identified asymmetric ‘pop-out’ and ‘hyperfolded’ configurations. These states are governed by three parameters — tilt angle, phase shift, and slant height — and enable discrete, programmable transformations. Using this model, we develop forward and inverse kinematic strategies to stack modules into deployable booms that approximate complex 3D shapes. We validate our approach through mechanical tests and demonstrate a tendon- and pneumatically-actuated Yoshimura Space Crane capable of object manipulation, solar tracking, and high load-bearing performance. A meter-scale solar charging station further illustrates the design’s scalability. These results establish Yoshimura-Ori structures as a promising platform for adaptable, multifunctional deployable systems in both terrestrial and space environments.

arxiv情報

著者 Ziyang Zhou,Yogesh Phalak,Vishrut Deshpande,Ian Walker,Suyi Li
発行日 2025-05-15 03:07:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Hyper Yoshimura: How a slight tweak on a classical folding pattern unleashes meta-stability for deployable robots はコメントを受け付けていません

Learning Diverse Natural Behaviors for Enhancing the Agility of Quadrupedal Robots

要約

動物のような敏ility性を達成することは、四角形ロボット工学の長年の目標です。
最近の研究は特定の行動の模倣を成功裏に実証していますが、ロボットが現実世界の環境でより広範な自然行動を複製できるようにすることは、依然としてオープンな課題です。
ここでは、基本的な動作コントローラー(BBC)とタスク固有のコントローラー(TSC)を含む統合コントローラーを提案します。タスク固有のコントローラーは、強化されたシミュレーターで多様な自然な四角形の動作を効果的に学習し、それらを現実世界に効率的に転送できます。
具体的には、BBCは、本物の犬の生のモーションキャプチャデータから多様な動作スタイルを抽出するために、新しい半監視生成官能的模倣学習アルゴリズムを使用して訓練され、個別の潜在的な可変入力を調整することによりスムーズな動作遷移を可能にします。
TSCは、入力として深さ画像を使用して特権学習を介して訓練され、BBCを調整して、さまざまなタスクを効率的に実行します。
さらに、進化的な敵対的なシミュレーターの識別を採用して、シミュレーターを最適化し、現実と密接に合わせています。
トレーニング後、ロボットは多様な自然行動を示し、平均速度1.1 m/sで四葉症の敏ility性チャレンジを正常に完了し、ハードル中に3.2 m/sのピーク速度を達成します。
この作業は、四角形ロボットにおける動物のような敏ility性への実質的なステップを表しており、ますます複雑になっている現実世界の環境での展開の手段を開きます。

要約(オリジナル)

Achieving animal-like agility is a longstanding goal in quadrupedal robotics. While recent studies have successfully demonstrated imitation of specific behaviors, enabling robots to replicate a broader range of natural behaviors in real-world environments remains an open challenge. Here we propose an integrated controller comprising a Basic Behavior Controller (BBC) and a Task-Specific Controller (TSC) which can effectively learn diverse natural quadrupedal behaviors in an enhanced simulator and efficiently transfer them to the real world. Specifically, the BBC is trained using a novel semi-supervised generative adversarial imitation learning algorithm to extract diverse behavioral styles from raw motion capture data of real dogs, enabling smooth behavior transitions by adjusting discrete and continuous latent variable inputs. The TSC, trained via privileged learning with depth images as input, coordinates the BBC to efficiently perform various tasks. Additionally, we employ evolutionary adversarial simulator identification to optimize the simulator, aligning it closely with reality. After training, the robot exhibits diverse natural behaviors, successfully completing the quadrupedal agility challenge at an average speed of 1.1 m/s and achieving a peak speed of 3.2 m/s during hurdling. This work represents a substantial step toward animal-like agility in quadrupedal robots, opening avenues for their deployment in increasingly complex real-world environments.

arxiv情報

著者 Huiqiao Fu,Haoyu Dong,Wentao Xu,Zhehao Zhou,Guizhou Deng,Kaiqiang Tang,Daoyi Dong,Chunlin Chen
発行日 2025-05-15 05:32:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Learning Diverse Natural Behaviors for Enhancing the Agility of Quadrupedal Robots はコメントを受け付けていません

Provably safe and human-like car-following behaviors: Part 1. Analysis of phases and dynamics in standard models

要約

軌道計画は、コミュニケーション、センシング、および天候、道路状況、政策、その他の道路利用者などの動的な要因に関連する不確実性に直面して安全な運転を確保するために不可欠です。
既存の自動車フォローモデルは、しばしば厳密な安全証明と、人間のような運転行動を一貫して複製する能力を欠いています。
この記事では、多相動的システム分析をよく知られている自動車フォローモデルに適用して、既存のアプローチの特性と制限を強調しています。
私たちは、快適さと最小ジャム間隔のためのゼロオーダーの原則、速度と時間のギャップのための1次原理、および快適加速/減速境界の2次原理、およびブレーキングプロフィールを含む、安全で人間のような自動車中の行動の基本原則を策定することから始めます。
これらのゼロトと1次原理のセットから、Newellの単純化された車によるモデルを導き出します。
その後、Newellのモデルの固定鉛車両問題と、境界加速度と減速の両方を組み込んだ拡張の速度間隔内のフェーズを分析します。
次に、インテリジェントドライバーモデルとGIPPSモデルのパフォーマンスを分析します。
この分析を通じて、前述の原則のいくつかに関して、これらのモデルの制限を強調します。
数値シミュレーションと経験的観測は、理論的洞察を検証します。
最後に、この研究のパート2で対処されている自動車中のモデルの安全性、人間のような行動、および車両自動化をさらに統合するための将来の研究の方向性について説明します。

要約(オリジナル)

Trajectory planning is essential for ensuring safe driving in the face of uncertainties related to communication, sensing, and dynamic factors such as weather, road conditions, policies, and other road users. Existing car-following models often lack rigorous safety proofs and the ability to replicate human-like driving behaviors consistently. This article applies multi-phase dynamical systems analysis to well-known car-following models to highlight the characteristics and limitations of existing approaches. We begin by formulating fundamental principles for safe and human-like car-following behaviors, which include zeroth-order principles for comfort and minimum jam spacings, first-order principles for speeds and time gaps, and second-order principles for comfort acceleration/deceleration bounds as well as braking profiles. From a set of these zeroth- and first-order principles, we derive Newell’s simplified car-following model. Subsequently, we analyze phases within the speed-spacing plane for the stationary lead-vehicle problem in Newell’s model and its extensions, which incorporate both bounded acceleration and deceleration. We then analyze the performance of the Intelligent Driver Model and the Gipps model. Through this analysis, we highlight the limitations of these models with respect to some of the aforementioned principles. Numerical simulations and empirical observations validate the theoretical insights. Finally, we discuss future research directions to further integrate safety, human-like behaviors, and vehicular automation in car-following models, which are addressed in Part 2 of this study \citep{jin2025WA20-02_Part2}, where we develop a novel multi-phase projection-based car-following model that addresses the limitations identified here.

arxiv情報

著者 Wen-Long Jin
発行日 2025-05-15 05:56:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY, physics.soc-ph | Provably safe and human-like car-following behaviors: Part 1. Analysis of phases and dynamics in standard models はコメントを受け付けていません

Provably safe and human-like car-following behaviors: Part 2. A parsimonious multi-phase model with projected braking

要約

現実世界の不確実性の中で自動化された車両の安全で人間のような軌道計画を確保することは、依然として重要な課題です。
既存の自動車フォローモデルは、人間のような加速と減速パターンとともに、一貫して厳密な安全証明を提供するのに苦労していますが、新しい多相投影ベースの自動車フォローモデルを導入します。
このモデルは、主要な人間の運転原則をエミュレートしながら、限界加速度と減速速度を組み込むことにより、安全性とパフォーマンスのバランスをとるように設計されています。
基本的な駆動原則と多相動的システム分析の基礎に基づいて(この研究のパート1で詳述されています\ citep {jin2025wa20-02_part1})、最初に、newellのような標準モデルの拡張の制限を単純な境界減速で強調します。
人間のドライバーの予測行動に触発されて、私たちはリーダー車とフォロワー車両の両方の予測されるブレーキプロファイルを数学的に定義および分析し、予測されるブレーキ鉛車両の問題に基づいて安全基準と新しい位相定義を確立します。
提案されているpar約的なモデルは、拡張されたNewellの名目運転のモデルを組み合わせて、予測されるブレーキを必要とするシナリオの新しい制御法と新しい制御法則を組み合わせています。
速度間隔の位相平面分析を使用して、合理的な初期条件下で、衝突のない操作、境界の減速、許容可能な安全停止距離など、定義された安全で人間のような運転原則に対するモデルの遵守の厳密な数学的証拠を提供します。
数値シミュレーションは、静止した鉛車両問題の安全性と人間のようなブレーキプロファイルの両方を達成する上で、モデルの優れたパフォーマンスを検証します。
最後に、モデルの意味と将来の研究の方向性について説明します。

要約(オリジナル)

Ensuring safe and human-like trajectory planning for automated vehicles amidst real-world uncertainties remains a critical challenge. While existing car-following models often struggle to consistently provide rigorous safety proofs alongside human-like acceleration and deceleration patterns, we introduce a novel multi-phase projection-based car-following model. This model is designed to balance safety and performance by incorporating bounded acceleration and deceleration rates while emulating key human driving principles. Building upon a foundation of fundamental driving principles and a multi-phase dynamical systems analysis (detailed in Part 1 of this study \citep{jin2025WA20-02_Part1}), we first highlight the limitations of extending standard models like Newell’s with simple bounded deceleration. Inspired by human drivers’ anticipatory behavior, we mathematically define and analyze projected braking profiles for both leader and follower vehicles, establishing safety criteria and new phase definitions based on the projected braking lead-vehicle problem. The proposed parsimonious model combines an extended Newell’s model for nominal driving with a new control law for scenarios requiring projected braking. Using speed-spacing phase plane analysis, we provide rigorous mathematical proofs of the model’s adherence to defined safe and human-like driving principles, including collision-free operation, bounded deceleration, and acceptable safe stopping distance, under reasonable initial conditions. Numerical simulations validate the model’s superior performance in achieving both safety and human-like braking profiles for the stationary lead-vehicle problem. Finally, we discuss the model’s implications and future research directions.

arxiv情報

著者 Wen-Long Jin
発行日 2025-05-15 06:03:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY, physics.soc-ph | Provably safe and human-like car-following behaviors: Part 2. A parsimonious multi-phase model with projected braking はコメントを受け付けていません

Multi-layer Motion Planning with Kinodynamic and Spatio-Temporal Constraints

要約

キノダイナミックと空間的制約の両方を満たすパスを計算するための新しい多層計画アプローチを提案します。
3部構成のフレームワークは、最初に空間制約を満たすための潜在的なシーケンスを確立し、それらを使用して幾何学的なリードパスを計算します。
このパスは、漸近的に最適なサンプリングベースの運動力学プランナーを導きます。これにより、STL堅牢性のコストが最小限に抑えられ、時空間および運動力学的制約が共同で満たされます。
実験では、速度制御されたアッカーマンカーモデルで方法をテストし、以前のARTと比較して有意な効率の向上を示します。
さらに、私たちの方法は、以前の方法が実証していなかったクロスオーバーなど、複雑なパス操作を生成することができます。

要約(オリジナル)

We propose a novel, multi-layered planning approach for computing paths that satisfy both kinodynamic and spatiotemporal constraints. Our three-part framework first establishes potential sequences to meet spatial constraints, using them to calculate a geometric lead path. This path then guides an asymptotically optimal sampling-based kinodynamic planner, which minimizes an STL-robustness cost to jointly satisfy spatiotemporal and kinodynamic constraints. In our experiments, we test our method with a velocity-controlled Ackerman-car model and demonstrate significant efficiency gains compared to prior art. Additionally, our method is able to generate complex path maneuvers, such as crossovers, something that previous methods had not demonstrated.

arxiv情報

著者 Jeel Chatrola,Abhiroop Ajith,Kevin Leahy,Constantinos Chamzas
発行日 2025-05-15 06:09:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | Multi-layer Motion Planning with Kinodynamic and Spatio-Temporal Constraints はコメントを受け付けていません

LEMON-Mapping: Loop-Enhanced Large-Scale Multi-Session Point Cloud Merging and Optimization for Globally Consistent Mapping

要約

ロボット工学の急速な発展に伴い、マルチロボットのコラボレーションは重要で挑戦的になりました。
重要な問題の1つは、複数のロボットからのデータを統合して、堅牢な協力と正確なローカリゼーションのためのグローバルに一貫した正確なマップを構築することです。
従来のマルチロボットポーズグラフ最適化(PGO)は基本的なグローバルな一貫性を維持していますが、主にポーズ最適化に焦点を当て、マップの幾何学的構造を無視します。
さらに、PGOは2つのノード間の制約としてループクロージャーのみを使用し、マルチロボットマップの局所的な一貫性を維持する能力を完全に活用できません。
したがって、PGOベースのマルチロボットマッピング方法は、特にサブマップが重複する地域では、深刻な地図の発散とぼやけに苦しむことがよくあります。
この問題に対処するために、レモンマッピング、大規模なマルチセッションポイントクラウドマップの融合と最適化のループ強化フレームワークを提案します。これは、ループクロージャーを合理的に利用し、マップの幾何学的品質を向上させます。
マルチロボットマッピングのループの役割を再検討し、3つの重要なイノベーションを導入します。
まず、外れ値を効果的に拒否する堅牢なループ処理メカニズムと、誤って削除されたループを回復するための新しいループリコール戦略を開発します。
第二に、重複する領域の発散を大幅に減らし、マップぼかしを排除するマルチロボットマップの空間バンドル調整方法を導入します。
第三に、バンドル調整の洗練された制約を活用して、ローカルの精度をグローバルマップに拡張するPGO戦略を設計します。
いくつかのパブリックデータセットと自己収集データセットでフレームワークを検証します。
実験結果は、私たちの方法が、マッピングの精度とマップの発散の削減のマッピングの観点から、従来のマップのマージアプローチよりも優れていることを示しています。
スケーラビリティ実験は、多数のロボットを含むシナリオを処理するフレームワークの強力な能力も示しています。

要約(オリジナル)

With the rapid development of robotics, multi-robot collaboration has become critical and challenging. One key problem is integrating data from multiple robots to build a globally consistent and accurate map for robust cooperation and precise localization. While traditional multi-robot pose graph optimization (PGO) maintains basic global consistency, it focuses primarily on pose optimization and ignores the geometric structure of the map. Moreover, PGO only uses loop closure as a constraint between two nodes, failing to fully exploit its capability to maintaining local consistency of multi-robot maps. Therefore, PGO-based multi-robot mapping methods often suffer from serious map divergence and blur, especially in regions with overlapping submaps. To address this issue, we propose Lemon-Mapping, a loop-enhanced framework for large-scale multi-session point cloud map fusion and optimization, which reasonably utilizes loop closure and improves the geometric quality of the map. We re-examine the role of loops for multi-robot mapping and introduce three key innovations. First, we develop a robust loop processing mechanism that effectively rejects outliers and a novel loop recall strategy to recover mistakenly removed loops. Second, we introduce a spatial bundle adjustment method for multi-robot maps that significantly reduces the divergence in overlapping regions and eliminates map blur. Third, we design a PGO strategy that leverages the refined constraints of bundle adjustment to extend the local accuracy to the global map. We validate our framework on several public datasets and a self-collected dataset. Experimental results demonstrate that our method outperforms traditional map merging approaches in terms of mapping accuracy and reduction of map divergence. Scalability experiments also demonstrate the strong capability of our framework to handle scenarios involving numerous robots.

arxiv情報

著者 Lijie Wang,Xiaoyi Zhong,Ziyi Xu,Kaixin Chai,Anke Zhao,Tianyu Zhao,Qianhao Wang,Fei Gao
発行日 2025-05-15 06:59:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO | LEMON-Mapping: Loop-Enhanced Large-Scale Multi-Session Point Cloud Merging and Optimization for Globally Consistent Mapping はコメントを受け付けていません

Threshold Strategy for Leaking Corner-Free Hamilton-Jacobi Reachability with Decomposed Computations

要約

Hamilton-Jacobi(HJ)Reachabilityは、特定の制御目標を満たす状態の価値関数を計算するために広く使用されています。
ただし、次元の呪いにより、高次元の問題には扱いにくいものになります。
この課題を緩和するためには、次元削減アプローチが不可欠ですが、「コーナーの漏れの問題」を導入することができ、結果の不正確さにつながる可能性があります。
この論文では、価値関数の観点から「コーナーの漏れの問題」を定義し、その発生に必要な条件を提案し、証明します。
次に、これらの理論的貢献を使用して、次元削減アプローチの計算効率を維持しながら、不正確な値関数を効率的に修正する新しいローカル更新方法を導入します。
数値シミュレーションを通じて、方法の有効性を実証します。
自己完結型のサブシステム分解(SCSD)を使用して方法を検証しますが、私たちのアプローチは「角を漏らす」他の次元削減技術に適用できます。

要約(オリジナル)

Hamilton-Jacobi (HJ) Reachability is widely used to compute value functions for states satisfying specific control objectives. However, it becomes intractable for high-dimensional problems due to the curse of dimensionality. Dimensionality reduction approaches are essential for mitigating this challenge, whereas they could introduce the “leaking corner issue’, leading to inaccuracies in the results. In this paper, we define the “leaking corner issue’ in terms of value functions, propose and prove a necessary condition for its occurrence. We then use these theoretical contributions to introduce a new local updating method that efficiently corrects inaccurate value functions while maintaining the computational efficiency of the dimensionality reduction approaches. We demonstrate the effectiveness of our method through numerical simulations. Although we validate our method with the self-contained subsystem decomposition (SCSD), our approach is applicable to other dimensionality reduction techniques that introduce the “leaking corners’.

arxiv情報

著者 Chong He,Mugilan Mariappan,Keval Vora,Mo Chen
発行日 2025-05-15 07:06:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SY, eess.SY | Threshold Strategy for Leaking Corner-Free Hamilton-Jacobi Reachability with Decomposed Computations はコメントを受け付けていません